<div dir="ltr">Actually now I'm confusing myself.  I didnt' change the const char * to a StringRef yet, so that doesn't need fixing yet, only need to keep it in mind in the future if we change raw strings to StringRefs.</div>
<div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, Aug 1, 2014 at 10:26 AM, Zachary Turner <span dir="ltr"><<a href="mailto:zturner@google.com" target="_blank">zturner@google.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Ahh, good point about the null const char*.  I'll definitely fix that before submitting.  It seems like we crossed paths, but did you see my message about submitting the optimization as a subsequent patch?  Are you ok with that?</div>
<div class="HOEnZb"><div class="h5">
<div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, Aug 1, 2014 at 10:20 AM, Greg Clayton <span dir="ltr"><<a href="mailto:gclayton@apple.com" target="_blank">gclayton@apple.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div><br>
> On Jul 31, 2014, at 10:18 AM, Zachary Turner <<a href="mailto:zturner@google.com" target="_blank">zturner@google.com</a>> wrote:<br>
><br>
> Just to expand a little more since my last post, the PathSyntax to the constructor and to SetFile() has a default value, which will do the right thing 99% of the time by selecting Host syntax.  You only need to specify it if you know what you're doing, so to speak.  But without being able to set it, there would be no way to have FileSpec represent a path on a remote machine.<br>


<br>
</div>So Jim changed my mind after speaking with him about specifying the PathSyntax, so I agree that is the right way to go.<br>
<div><br>
><br>
> As for the performance cost of normalization, SmallString<64> only does a malloc if the string is longer than 64 characters.  I could try increasing the number, I think 128 would cover probably 95% of all file paths.  I agree in principle that it would be nice to not normalize the string on every file set, one idea would be to never normalize it if PathSyntax = Posix (since Normalized form is by definition Posix form) and always normalize it otherwise.<br>


<br>
</div>I still think we should avoid making the copy if it is already normalized. I would be fine if posix never normalized but it does for other syntaxes.<br>
<div><br>
>  But then to avoid the copy I would need to change the SetFile()'s signature to accept a SmallString instead of a const char*.<br>
<br>
</div>Why can't Normalize and Denormalize return a bool: false if no normalization was a needed, and true if it was normalized. Then just have FileSpec::SetFile() use a llvm::StringRef after the call to normalize which will contain the raw "pathname" if no normalization was needed or the contents of "normalized" if it was normalized.<br>


<div><br>
<br>
> I actually thinking changing raw strings to LLVM strings is a good change, but it's probably going to result in some unrelated churn fixing up function signatures elsewhere, so doing that iteratively as a separate change might make more sense.<br>


<br>
</div>Feel free to make two FileSpec::SetFile() functions:<br>
<br>
void<br>
FileSpec::SetFile (const char *path_cstr);<br>
<br>
void<br>
FileSpec::SetFile (const llvm::StringRef &path);<br>
<br>
Then the const char * version would call the llvm::StringRef version. We don't to allow just the llvm::StringRef version because if you pass in NULL StringRef will crash with an assert.<br>
<br>
> Thoughts?<br>
<br>
Let me know what you think about the above comments.<br>
<span><font color="#888888"><br>
Greg<br>
</font></span><div><div><br>
><br>
><br>
> On Wed, Jul 30, 2014 at 6:50 PM, Greg Clayton <<a href="mailto:gclayton@apple.com" target="_blank">gclayton@apple.com</a>> wrote:<br>
> Looks ok, a few questions:<br>
><br>
> Why does the user ever want to specify the PathSyntax? Shouldn't it just be something that can be queried and be set automagically?<br>
><br>
> What if I did:<br>
><br>
> FileSpec f("C:\Users\me\foo.txt", false, ePathSyntaxPosix);<br>
><br>
> If I set it incorrectly, seems like it might "do the wrong thing" in some calls. It might be nice to use a C++11 typed bitfield to store the PathSyntax to keep the size of the FileSpec class down to as small as possible (uint8_t).<br>


><br>
> All the other functionality seems fine.<br>
><br>
> A few things to keep in mind:<br>
><br>
> All debug info is parsed and stored into FileSpec objects. They must match exactly what the user types. What if the user types in:<br>
><br>
> (lldb) breakpoint set --file C:/Users/me/foo.txt<br>
><br>
> Note the wrong slashes. Are we alway normalizing a path to be native so that this kind of compare will always work even if the user types it in wrong?<br>
><br>
> Seems like we shouldn't allow the user to specify the PathSyntax or we can run into problems.<br>
><br>
> Also seems like we should check if a string needs to be normalized before calling Normalize and allocating memory and copying and replacing things which can be expensive (think parsing thousands of line table files).<br>


><br>
> So I would vote to:<br>
> 1 - fix it so the user never specifies PathSyntax, but can query it if desired<br>
> 2 - I would rather not normalize the path on every FileSpec::SetFile(...) if we can avoid it as it will be expensive<br>
> 3 - If we do need to normalize it every time, either have Normalize return false and not touch the llvm::SmallString<64> argument (no mallocs) if it doesn't need to be normalized to avoid expensive allocations if not required.<br>


><br>
> > On Jul 30, 2014, at 4:49 PM, Zachary Turner <<a href="mailto:zturner@google.com" target="_blank">zturner@google.com</a>> wrote:<br>
> ><br>
> >>> ! In D4675#11, @deepak2427 wrote:<br>
> >> Thanks for fixing this. I haven't had a chance to test this patch with our cross-platform issues yet, have to look at some other issues first.<br>
> >> Just a couple of doubts I had.<br>
> >><br>
> >> - Are the paths always going to default as ePathSyntaxHostNative and then converted based on the Host?<br>
> >> - In 733       llvm::SmallString<64> denormalized; , is the length of 64 enough?<br>
> >> - I'm not that familiar with LLVM data structures, however would it be better to keep llvm::SmallString itself for the Normalize/Denormalize functions to keep it consistent?<br>
> ><br>
> > Paths default to SyntaxHostNative because that makes the semantics post-patch equivalent to pre-patch.  Normalized form is basically unix form, so if the syntax ends up as ePathSyntaxPosix (either because it was explicitly specified or because host was specified and your host is posix), then normalization and de-normalization are both no-ops.<br>


> ><br>
> > SmallString<64> just means that it keeps 64 bytes on the stack, and if it grows longer than that, it will fallback to help allocation.  It still supports arbitrarily long strings, but paths tend to be small, so that's why a small number was chosen.<br>


> ><br>
> > <a href="http://reviews.llvm.org/D4675" target="_blank">http://reviews.llvm.org/D4675</a><br>
> ><br>
> ><br>
> ><br>
> > _______________________________________________<br>
> > lldb-commits mailing list<br>
> > <a href="mailto:lldb-commits@cs.uiuc.edu" target="_blank">lldb-commits@cs.uiuc.edu</a><br>
> > <a href="http://lists.cs.uiuc.edu/mailman/listinfo/lldb-commits" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/lldb-commits</a><br>
><br>
><br>
<br>
</div></div></blockquote></div><br></div>
</div></div></blockquote></div><br></div>