<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Wed, Dec 18, 2013 at 10:34 PM, Alp Toker <span dir="ltr"><<a href="mailto:alp@nuanti.com" target="_blank" class="cremed">alp@nuanti.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Author: alp<br>
Date: Wed Dec 18 15:34:07 2013<br>
New Revision: 197608<br>
<br>
URL: <a href="http://llvm.org/viewvc/llvm-project?rev=197608&view=rev" target="_blank" class="cremed">http://llvm.org/viewvc/llvm-project?rev=197608&view=rev</a><br>
Log:<br>
clang-format-diff.py: fix -regex/-iregex matching<br>
<br>
While debating the finer points of file extension matching, we somehow missed<br>
the bigger problem that the current code will match anything starting with the<br>
default or user-specified pattern (e.g. <a href="http://lit.site.cfg.in" target="_blank" class="cremed">lit.site.cfg.in</a>).<br>
<br>
Fix this by doing what find(1) does, implicitly wrapping the pattern with ^$.<br>
<br>
Modified:<br>
    cfe/trunk/tools/clang-format/clang-format-diff.py<br>
<br>
Modified: cfe/trunk/tools/clang-format/clang-format-diff.py<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/cfe/trunk/tools/clang-format/clang-format-diff.py?rev=197608&r1=197607&r2=197608&view=diff" target="_blank" class="cremed">http://llvm.org/viewvc/llvm-project/cfe/trunk/tools/clang-format/clang-format-diff.py?rev=197608&r1=197607&r2=197608&view=diff</a><br>

==============================================================================<br>
--- cfe/trunk/tools/clang-format/clang-format-diff.py (original)<br>
+++ cfe/trunk/tools/clang-format/clang-format-diff.py Wed Dec 18 15:34:07 2013<br>
@@ -43,7 +43,7 @@ def main():<br>
                       help='apply edits to files instead of displaying a diff')<br>
   parser.add_argument('-p', metavar='NUM', default=0,<br>
                       help='strip the smallest prefix containing P slashes')<br>
-  parser.add_argument('-regex', metavar='PATTERN', default='',<br>
+  parser.add_argument('-regex', metavar='PATTERN', default=None,<br>
                       help='custom pattern selecting file paths to reformat '<br>
                       '(case sensitive, override -iregex)')<br>
   parser.add_argument('-iregex', metavar='PATTERN', default=<br>
@@ -66,11 +66,11 @@ def main():<br>
     if filename == None:<br>
       continue<br>
<br>
-    if args.regex != '':<br>
-      if not re.match(args.regex, filename):<br>
+    if args.regex is not None:<br></blockquote><div><br></div><div>I am not opposed, but was there a particular reason to change '' to None?</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

+      if not re.match('^%s$' % args.regex, filename):<br></blockquote><div><br></div><div>AFAIK, re.match() only matches if the regex matches from the beginning of the string. So, the "^" is unnecessary. The "$" is a good idea, though :-).</div>
<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
         continue<br>
     else:<br>
-      if not re.match(args.iregex, filename, re.IGNORECASE):<br>
+      if not re.match('^%s$' % args.iregex, filename, re.IGNORECASE):<br>
         continue<br>
<br>
     match = re.search('^@@.*\+(\d+)(,(\d+))?', line)<br>
<br>
<br>
_______________________________________________<br>
cfe-commits mailing list<br>
<a href="mailto:cfe-commits@cs.uiuc.edu" class="cremed">cfe-commits@cs.uiuc.edu</a><br>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/cfe-commits" target="_blank" class="cremed">http://lists.cs.uiuc.edu/mailman/listinfo/cfe-commits</a><br>
</blockquote></div><br></div></div>