<html>
  <head>
    <meta http-equiv="content-type" content="text/html;
      charset=ISO-8859-1">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Hi,<br>
      Sorry for the delay. Thanks for the comments, Doug!<br>
    The attached, simple, patch enables clang to compile incrementally
    given input.<br>
    Okay to commit?<br>
    <br>
    Vassil<br>
    <br>
    -------- Original Message --------
    <table class="moz-email-headers-table" border="0" cellpadding="0"
      cellspacing="0">
      <tbody>
        <tr>
          <th align="RIGHT" nowrap="nowrap" valign="BASELINE">Subject: </th>
          <td>Re: [cfe-dev] Incremental parsing/compilation question</td>
        </tr>
        <tr>
          <th align="RIGHT" nowrap="nowrap" valign="BASELINE">Date: </th>
          <td>Fri, 2 Dec 2011 07:43:55 -0800</td>
        </tr>
        <tr>
          <th align="RIGHT" nowrap="nowrap" valign="BASELINE">From: </th>
          <td>Douglas Gregor <a moz-do-not-send="true"
              class="moz-txt-link-rfc2396E"
              href="mailto:dgregor@apple.com"><dgregor@apple.com></a></td>
        </tr>
        <tr>
          <th align="RIGHT" nowrap="nowrap" valign="BASELINE">To: </th>
          <td>Vassil Vassilev <a moz-do-not-send="true"
              class="moz-txt-link-rfc2396E"
              href="mailto:vasil.georgiev.vasilev@cern.ch"><vasil.georgiev.vasilev@cern.ch></a></td>
        </tr>
        <tr>
          <th align="RIGHT" nowrap="nowrap" valign="BASELINE">CC: </th>
          <td><a moz-do-not-send="true" class="moz-txt-link-abbreviated"
              href="mailto:cfe-dev@cs.uiuc.edu">cfe-dev@cs.uiuc.edu</a>
            <a moz-do-not-send="true" class="moz-txt-link-rfc2396E"
              href="mailto:cfe-dev@cs.uiuc.edu"><cfe-dev@cs.uiuc.edu></a></td>
        </tr>
      </tbody>
    </table>
    <br>
    <br>
    <pre>On Dec 2, 2011, at 7:02 AM, Vassil Vassilev wrote:

> Hi,

> In cling we have line-by-line input that comes from a terminal-like prompt.
> We do incremental compilation of the input.  The input lines come as 
> llvm::MemoryBuffers
> We compile each memory buffer by passing them to clang.  However, when clang
> parses a buffer it sees EOF in the end and destroys it's current lexer 
> and what not.

> For example cling can have:
> [cling$] extern "C" int printf(const char* fmt, ...);
> [cling$] int i = 12;
> [cling$] printf("%d\n", i);

> Every line comes in memory buffer containing \0 in the end.  Clang 
> considers that as
> an EOF.  Ideally I want to tell the parser that the parsing of the 
> translation unit is not
> yet done, but that it should be suspended until next user's input.

> Correct me if I am wrong, but the best way of doing that would be to 
> implement a
> 'suspend' token.  When the lexer and parser see that 'suspend' token 
> they would stop
> as if it was EOF token but without deleting/cleaning anything, so that 
> the parsing could
> be restarted later with the same state.

'suspend' should probably just be a special handling of the 'eof' token, so that the parser/lexer doesn't tear everything down (but otherwise acts exactly the same). We don't want the parser or preprocessor to have to check 'is this eof or suspend?' every time it currently checks for eof.

> If this is the right approach what would be the best way to represent 
> the 'suspend'
> token?  i.e. which ascii char that would trigger the suspension?   (I'd 
> really like to have
> "$" but it is already part of an extension).


I suggest looking at how the code-completion token is created. It uses \0 + a file offset to distinguish between a \0 at the end of the buffer and an embedded \0 that is the code completion point.

        - Doug
</pre>
  </body>
</html>