/ Hex Artifact Content
Login

Artifact af92cdaa5058fcec1451e49becc7ba44dba023dc:


0000: 2f 2a 0a 2a 2a 20 32 30 31 32 2d 31 31 2d 31 33  /*.** 2012-11-13
0010: 0a 2a 2a 0a 2a 2a 20 54 68 65 20 61 75 74 68 6f  .**.** The autho
0020: 72 20 64 69 73 63 6c 61 69 6d 73 20 63 6f 70 79  r disclaims copy
0030: 72 69 67 68 74 20 74 6f 20 74 68 69 73 20 73 6f  right to this so
0040: 75 72 63 65 20 63 6f 64 65 2e 20 20 49 6e 20 70  urce code.  In p
0050: 6c 61 63 65 20 6f 66 0a 2a 2a 20 61 20 6c 65 67  lace of.** a leg
0060: 61 6c 20 6e 6f 74 69 63 65 2c 20 68 65 72 65 20  al notice, here 
0070: 69 73 20 61 20 62 6c 65 73 73 69 6e 67 3a 0a 2a  is a blessing:.*
0080: 2a 0a 2a 2a 20 20 20 20 4d 61 79 20 79 6f 75 20  *.**    May you 
0090: 64 6f 20 67 6f 6f 64 20 61 6e 64 20 6e 6f 74 20  do good and not 
00a0: 65 76 69 6c 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  evil..**    May 
00b0: 79 6f 75 20 66 69 6e 64 20 66 6f 72 67 69 76 65  you find forgive
00c0: 6e 65 73 73 20 66 6f 72 20 79 6f 75 72 73 65 6c  ness for yoursel
00d0: 66 20 61 6e 64 20 66 6f 72 67 69 76 65 20 6f 74  f and forgive ot
00e0: 68 65 72 73 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  hers..**    May 
00f0: 79 6f 75 20 73 68 61 72 65 20 66 72 65 65 6c 79  you share freely
0100: 2c 20 6e 65 76 65 72 20 74 61 6b 69 6e 67 20 6d  , never taking m
0110: 6f 72 65 20 74 68 61 6e 20 79 6f 75 20 67 69 76  ore than you giv
0120: 65 2e 0a 2a 2a 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  e..**.**********
0130: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0140: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0150: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0160: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0170: 2a 2a 2a 2a 0a 2a 2a 0a 2a 2a 20 54 68 65 20 63  ****.**.** The c
0180: 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c 65  ode in this file
0190: 20 69 6d 70 6c 65 6d 65 6e 74 73 20 61 20 63 6f   implements a co
01a0: 6d 70 61 63 74 20 62 75 74 20 72 65 61 73 6f 6e  mpact but reason
01b0: 61 62 6c 79 0a 2a 2a 20 65 66 66 69 63 69 65 6e  ably.** efficien
01c0: 74 20 72 65 67 75 6c 61 72 2d 65 78 70 72 65 73  t regular-expres
01d0: 73 69 6f 6e 20 6d 61 74 63 68 65 72 20 66 6f 72  sion matcher for
01e0: 20 70 6f 73 69 78 20 65 78 74 65 6e 64 65 64 20   posix extended 
01f0: 72 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70 72 65  regular.** expre
0200: 73 73 69 6f 6e 73 20 61 67 61 69 6e 73 74 20 55  ssions against U
0210: 54 46 38 20 74 65 78 74 2e 0a 2a 2a 0a 2a 2a 20  TF8 text..**.** 
0220: 54 68 69 73 20 66 69 6c 65 20 69 73 20 61 6e 20  This file is an 
0230: 53 51 4c 69 74 65 20 65 78 74 65 6e 73 69 6f 6e  SQLite extension
0240: 2e 20 20 49 74 20 72 65 67 69 73 74 65 72 73 20  .  It registers 
0250: 61 20 73 69 6e 67 6c 65 20 66 75 6e 63 74 69 6f  a single functio
0260: 6e 0a 2a 2a 20 6e 61 6d 65 64 20 22 72 65 67 65  n.** named "rege
0270: 78 70 28 41 2c 42 29 22 20 77 68 65 72 65 20 41  xp(A,B)" where A
0280: 20 69 73 20 74 68 65 20 72 65 67 75 6c 61 72 20   is the regular 
0290: 65 78 70 72 65 73 73 69 6f 6e 20 61 6e 64 20 42  expression and B
02a0: 20 69 73 20 74 68 65 0a 2a 2a 20 73 74 72 69 6e   is the.** strin
02b0: 67 20 74 6f 20 62 65 20 6d 61 74 63 68 65 64 2e  g to be matched.
02c0: 20 20 42 79 20 72 65 67 69 73 74 65 72 69 6e 67    By registering
02d0: 20 74 68 69 73 20 66 75 6e 63 74 69 6f 6e 2c 20   this function, 
02e0: 53 51 4c 69 74 65 20 77 69 6c 6c 20 61 6c 73 6f  SQLite will also
02f0: 0a 2a 2a 20 74 68 65 6e 20 69 6d 70 6c 65 6d 65  .** then impleme
0300: 6e 74 20 74 68 65 20 22 42 20 72 65 67 65 78 70  nt the "B regexp
0310: 20 41 22 20 6f 70 65 72 61 74 6f 72 2e 20 20 4e   A" operator.  N
0320: 6f 74 65 20 74 68 61 74 20 77 69 74 68 20 74 68  ote that with th
0330: 65 20 66 75 6e 63 74 69 6f 6e 0a 2a 2a 20 74 68  e function.** th
0340: 65 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73  e regular expres
0350: 73 69 6f 6e 20 63 6f 6d 65 73 20 66 69 72 73 74  sion comes first
0360: 2c 20 62 75 74 20 77 69 74 68 20 74 68 65 20 6f  , but with the o
0370: 70 65 72 61 74 6f 72 20 69 74 20 63 6f 6d 65 73  perator it comes
0380: 0a 2a 2a 20 73 65 63 6f 6e 64 2e 0a 2a 2a 0a 2a  .** second..**.*
0390: 2a 20 20 54 68 65 20 66 6f 6c 6c 6f 77 69 6e 67  *  The following
03a0: 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73 73   regular express
03b0: 69 6f 6e 20 73 79 6e 74 61 78 20 69 73 20 73 75  ion syntax is su
03c0: 70 70 6f 72 74 65 64 3a 0a 2a 2a 0a 2a 2a 20 20  pported:.**.**  
03d0: 20 20 20 58 2a 20 20 20 20 20 20 7a 65 72 6f 20     X*      zero 
03e0: 6f 72 20 6d 6f 72 65 20 6f 63 63 75 72 72 65 6e  or more occurren
03f0: 63 65 73 20 6f 66 20 58 0a 2a 2a 20 20 20 20 20  ces of X.**     
0400: 58 2b 20 20 20 20 20 20 6f 6e 65 20 6f 72 20 6d  X+      one or m
0410: 6f 72 65 20 6f 63 63 75 72 72 65 6e 63 65 73 20  ore occurrences 
0420: 6f 66 20 58 0a 2a 2a 20 20 20 20 20 58 3f 20 20  of X.**     X?  
0430: 20 20 20 20 7a 65 72 6f 20 6f 72 20 6f 6e 65 20      zero or one 
0440: 6f 63 63 75 72 72 65 6e 63 65 73 20 6f 66 20 58  occurrences of X
0450: 0a 2a 2a 20 20 20 20 20 58 7b 70 2c 71 7d 20 20  .**     X{p,q}  
0460: 62 65 74 77 65 65 6e 20 70 20 61 6e 64 20 71 20  between p and q 
0470: 6f 63 63 75 72 72 65 6e 63 65 73 20 6f 66 20 58  occurrences of X
0480: 0a 2a 2a 20 20 20 20 20 28 58 29 20 20 20 20 20  .**     (X)     
0490: 6d 61 74 63 68 20 58 0a 2a 2a 20 20 20 20 20 58  match X.**     X
04a0: 7c 59 20 20 20 20 20 58 20 6f 72 20 59 0a 2a 2a  |Y     X or Y.**
04b0: 20 20 20 20 20 5e 58 20 20 20 20 20 20 58 20 6f       ^X      X o
04c0: 63 63 75 72 72 69 6e 67 20 61 74 20 74 68 65 20  ccurring at the 
04d0: 62 65 67 69 6e 6e 69 6e 67 20 6f 66 20 74 68 65  beginning of the
04e0: 20 73 74 72 69 6e 67 0a 2a 2a 20 20 20 20 20 58   string.**     X
04f0: 24 20 20 20 20 20 20 58 20 6f 63 63 75 72 72 69  $      X occurri
0500: 6e 67 20 61 74 20 74 68 65 20 65 6e 64 20 6f 66  ng at the end of
0510: 20 74 68 65 20 73 74 72 69 6e 67 0a 2a 2a 20 20   the string.**  
0520: 20 20 20 2e 20 20 20 20 20 20 20 4d 61 74 63 68     .       Match
0530: 20 61 6e 79 20 73 69 6e 67 6c 65 20 63 68 61 72   any single char
0540: 61 63 74 65 72 0a 2a 2a 20 20 20 20 20 5c 63 20  acter.**     \c 
0550: 20 20 20 20 20 43 68 61 72 61 63 74 65 72 20 63       Character c
0560: 20 77 68 65 72 65 20 63 20 69 73 20 6f 6e 65 20   where c is one 
0570: 6f 66 20 5c 7b 7d 28 29 5b 5d 7c 2a 2b 3f 2e 0a  of \{}()[]|*+?..
0580: 2a 2a 20 20 20 20 20 5c 63 20 20 20 20 20 20 43  **     \c      C
0590: 2d 6c 61 6e 67 75 61 67 65 20 65 73 63 61 70 65  -language escape
05a0: 73 20 66 6f 72 20 63 20 69 6e 20 61 66 6e 72 74  s for c in afnrt
05b0: 76 2e 20 20 65 78 3a 20 5c 74 20 6f 72 20 5c 6e  v.  ex: \t or \n
05c0: 0a 2a 2a 20 20 20 20 20 5c 75 58 58 58 58 20 20  .**     \uXXXX  
05d0: 57 68 65 72 65 20 58 58 58 58 20 69 73 20 65 78  Where XXXX is ex
05e0: 61 63 74 6c 79 20 34 20 68 65 78 20 64 69 67 69  actly 4 hex digi
05f0: 74 73 2c 20 75 6e 69 63 6f 64 65 20 76 61 6c 75  ts, unicode valu
0600: 65 20 58 58 58 58 0a 2a 2a 20 20 20 20 20 5c 78  e XXXX.**     \x
0610: 58 58 20 20 20 20 57 68 65 72 65 20 58 58 20 69  XX    Where XX i
0620: 73 20 65 78 61 63 74 6c 79 20 32 20 68 65 78 20  s exactly 2 hex 
0630: 64 69 67 69 74 73 2c 20 75 6e 69 63 6f 64 65 20  digits, unicode 
0640: 76 61 6c 75 65 20 58 58 0a 2a 2a 20 20 20 20 20  value XX.**     
0650: 5b 61 62 63 5d 20 20 20 41 6e 79 20 73 69 6e 67  [abc]   Any sing
0660: 6c 65 20 63 68 61 72 61 63 74 65 72 20 66 72 6f  le character fro
0670: 6d 20 74 68 65 20 73 65 74 20 61 62 63 0a 2a 2a  m the set abc.**
0680: 20 20 20 20 20 5b 5e 61 62 63 5d 20 20 41 6e 79       [^abc]  Any
0690: 20 73 69 6e 67 6c 65 20 63 68 61 72 61 63 74 65   single characte
06a0: 72 20 6e 6f 74 20 69 6e 20 74 68 65 20 73 65 74  r not in the set
06b0: 20 61 62 63 0a 2a 2a 20 20 20 20 20 5b 61 2d 7a   abc.**     [a-z
06c0: 5d 20 20 20 41 6e 79 20 73 69 6e 67 6c 65 20 63  ]   Any single c
06d0: 68 61 72 61 63 74 65 72 20 69 6e 20 74 68 65 20  haracter in the 
06e0: 72 61 6e 67 65 20 61 2d 7a 0a 2a 2a 20 20 20 20  range a-z.**    
06f0: 20 5b 5e 61 2d 7a 5d 20 20 41 6e 79 20 73 69 6e   [^a-z]  Any sin
0700: 67 6c 65 20 63 68 61 72 61 63 74 65 72 20 6e 6f  gle character no
0710: 74 20 69 6e 20 74 68 65 20 72 61 6e 67 65 20 61  t in the range a
0720: 2d 7a 0a 2a 2a 20 20 20 20 20 5c 62 20 20 20 20  -z.**     \b    
0730: 20 20 57 6f 72 64 20 62 6f 75 6e 64 61 72 79 0a    Word boundary.
0740: 2a 2a 20 20 20 20 20 5c 77 20 20 20 20 20 20 57  **     \w      W
0750: 6f 72 64 20 63 68 61 72 61 63 74 65 72 2e 20 20  ord character.  
0760: 5b 41 2d 5a 61 2d 7a 30 2d 39 5f 5d 0a 2a 2a 20  [A-Za-z0-9_].** 
0770: 20 20 20 20 5c 57 20 20 20 20 20 20 4e 6f 6e 2d      \W      Non-
0780: 77 6f 72 64 20 63 68 61 72 61 63 74 65 72 0a 2a  word character.*
0790: 2a 20 20 20 20 20 5c 64 20 20 20 20 20 20 44 69  *     \d      Di
07a0: 67 69 74 0a 2a 2a 20 20 20 20 20 5c 44 20 20 20  git.**     \D   
07b0: 20 20 20 4e 6f 6e 2d 64 69 67 69 74 0a 2a 2a 20     Non-digit.** 
07c0: 20 20 20 20 5c 73 20 20 20 20 20 20 57 68 69 74      \s      Whit
07d0: 65 73 70 61 63 65 20 63 68 61 72 61 63 74 65 72  espace character
07e0: 0a 2a 2a 20 20 20 20 20 5c 53 20 20 20 20 20 20  .**     \S      
07f0: 4e 6f 6e 2d 77 68 69 74 65 73 70 61 63 65 20 63  Non-whitespace c
0800: 68 61 72 61 63 74 65 72 0a 2a 2a 0a 2a 2a 20 41  haracter.**.** A
0810: 20 6e 6f 6e 64 65 74 65 72 6d 69 6e 69 73 74 69   nondeterministi
0820: 63 20 66 69 6e 69 74 65 20 61 75 74 6f 6d 61 74  c finite automat
0830: 6f 6e 20 28 4e 46 41 29 20 69 73 20 75 73 65 64  on (NFA) is used
0840: 20 66 6f 72 20 6d 61 74 63 68 69 6e 67 2c 20 73   for matching, s
0850: 6f 20 74 68 65 0a 2a 2a 20 70 65 72 66 6f 72 6d  o the.** perform
0860: 61 6e 63 65 20 69 73 20 62 6f 75 6e 64 65 64 20  ance is bounded 
0870: 62 79 20 4f 28 4e 2a 4d 29 20 77 68 65 72 65 20  by O(N*M) where 
0880: 4e 20 69 73 20 74 68 65 20 73 69 7a 65 20 6f 66  N is the size of
0890: 20 74 68 65 20 72 65 67 75 6c 61 72 0a 2a 2a 20   the regular.** 
08a0: 65 78 70 72 65 73 73 69 6f 6e 20 61 6e 64 20 4d  expression and M
08b0: 20 69 73 20 74 68 65 20 73 69 7a 65 20 6f 66 20   is the size of 
08c0: 74 68 65 20 69 6e 70 75 74 20 73 74 72 69 6e 67  the input string
08d0: 2e 20 20 54 68 65 20 6d 61 74 63 68 65 72 20 6e  .  The matcher n
08e0: 65 76 65 72 0a 2a 2a 20 65 78 68 69 62 69 74 73  ever.** exhibits
08f0: 20 65 78 70 6f 6e 65 6e 74 69 61 6c 20 62 65 68   exponential beh
0900: 61 76 69 6f 72 2e 20 20 4e 6f 74 65 20 74 68 61  avior.  Note tha
0910: 74 20 74 68 65 20 58 7b 70 2c 71 7d 20 6f 70 65  t the X{p,q} ope
0920: 72 61 74 6f 72 20 65 78 70 61 6e 64 73 0a 2a 2a  rator expands.**
0930: 20 74 6f 20 70 20 63 6f 70 69 65 73 20 6f 66 20   to p copies of 
0940: 58 20 66 6f 6c 6c 6f 77 69 6e 67 20 62 79 20 71  X following by q
0950: 2d 70 20 63 6f 70 69 65 73 20 6f 66 20 58 3f 20  -p copies of X? 
0960: 61 6e 64 20 74 68 61 74 20 74 68 65 20 73 69 7a  and that the siz
0970: 65 20 6f 66 20 74 68 65 0a 2a 2a 20 72 65 67 75  e of the.** regu
0980: 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20 69  lar expression i
0990: 6e 20 74 68 65 20 4f 28 4e 2a 4d 29 20 70 65 72  n the O(N*M) per
09a0: 66 6f 72 6d 61 6e 63 65 20 62 6f 75 6e 64 20 69  formance bound i
09b0: 73 20 63 6f 6d 70 75 74 65 64 20 61 66 74 65 72  s computed after
09c0: 0a 2a 2a 20 74 68 69 73 20 65 78 70 61 6e 73 69  .** this expansi
09d0: 6f 6e 2e 0a 2a 2f 0a 23 69 6e 63 6c 75 64 65 20  on..*/.#include 
09e0: 3c 73 74 72 69 6e 67 2e 68 3e 0a 23 69 6e 63 6c  <string.h>.#incl
09f0: 75 64 65 20 3c 73 74 64 6c 69 62 2e 68 3e 0a 23  ude <stdlib.h>.#
0a00: 69 6e 63 6c 75 64 65 20 22 73 71 6c 69 74 65 33  include "sqlite3
0a10: 65 78 74 2e 68 22 0a 53 51 4c 49 54 45 5f 45 58  ext.h".SQLITE_EX
0a20: 54 45 4e 53 49 4f 4e 5f 49 4e 49 54 31 0a 0a 2f  TENSION_INIT1../
0a30: 2a 0a 2a 2a 20 54 68 65 20 66 6f 6c 6c 6f 77 69  *.** The followi
0a40: 6e 67 20 23 64 65 66 69 6e 65 73 20 63 68 61 6e  ng #defines chan
0a50: 67 65 20 74 68 65 20 6e 61 6d 65 73 20 6f 66 20  ge the names of 
0a60: 73 6f 6d 65 20 66 75 6e 63 74 69 6f 6e 73 20 69  some functions i
0a70: 6d 70 6c 65 6d 65 6e 74 65 64 20 69 6e 0a 2a 2a  mplemented in.**
0a80: 20 74 68 69 73 20 66 69 6c 65 20 74 6f 20 70 72   this file to pr
0a90: 65 76 65 6e 74 20 6e 61 6d 65 20 63 6f 6c 6c 69  event name colli
0aa0: 73 69 6f 6e 73 20 77 69 74 68 20 43 2d 6c 69 62  sions with C-lib
0ab0: 72 61 72 79 20 66 75 6e 63 74 69 6f 6e 73 20 6f  rary functions o
0ac0: 66 20 74 68 65 0a 2a 2a 20 73 61 6d 65 20 6e 61  f the.** same na
0ad0: 6d 65 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 72  me..*/.#define r
0ae0: 65 5f 6d 61 74 63 68 20 20 20 73 71 6c 69 74 65  e_match   sqlite
0af0: 33 72 65 5f 6d 61 74 63 68 0a 23 64 65 66 69 6e  3re_match.#defin
0b00: 65 20 72 65 5f 63 6f 6d 70 69 6c 65 20 73 71 6c  e re_compile sql
0b10: 69 74 65 33 72 65 5f 63 6f 6d 70 69 6c 65 0a 23  ite3re_compile.#
0b20: 64 65 66 69 6e 65 20 72 65 5f 66 72 65 65 20 20  define re_free  
0b30: 20 20 73 71 6c 69 74 65 33 72 65 5f 66 72 65 65    sqlite3re_free
0b40: 0a 0a 2f 2a 20 54 68 65 20 65 6e 64 2d 6f 66 2d  ../* The end-of-
0b50: 69 6e 70 75 74 20 63 68 61 72 61 63 74 65 72 20  input character 
0b60: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 45 4f  */.#define RE_EO
0b70: 46 20 20 20 20 20 20 20 20 20 20 20 20 30 20 20  F            0  
0b80: 20 20 2f 2a 20 45 6e 64 20 6f 66 20 69 6e 70 75    /* End of inpu
0b90: 74 20 2a 2f 0a 0a 2f 2a 20 54 68 65 20 4e 46 41  t */../* The NFA
0ba0: 20 69 73 20 69 6d 70 6c 65 6d 65 6e 74 65 64 20   is implemented 
0bb0: 61 73 20 73 65 71 75 65 6e 63 65 20 6f 66 20 6f  as sequence of o
0bc0: 70 63 6f 64 65 73 20 74 61 6b 65 6e 20 66 72 6f  pcodes taken fro
0bd0: 6d 20 74 68 65 20 66 6f 6c 6c 6f 77 69 6e 67 0a  m the following.
0be0: 2a 2a 20 73 65 74 2e 20 20 45 61 63 68 20 6f 70  ** set.  Each op
0bf0: 63 6f 64 65 20 68 61 73 20 61 20 73 69 6e 67 6c  code has a singl
0c00: 65 20 69 6e 74 65 67 65 72 20 61 72 67 75 6d 65  e integer argume
0c10: 6e 74 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 52  nt..*/.#define R
0c20: 45 5f 4f 50 5f 4d 41 54 43 48 20 20 20 20 20 20  E_OP_MATCH      
0c30: 20 31 20 20 20 20 2f 2a 20 4d 61 74 63 68 20 74   1    /* Match t
0c40: 68 65 20 6f 6e 65 20 63 68 61 72 61 63 74 65 72  he one character
0c50: 20 69 6e 20 74 68 65 20 61 72 67 75 6d 65 6e 74   in the argument
0c60: 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f   */.#define RE_O
0c70: 50 5f 41 4e 59 20 20 20 20 20 20 20 20 20 32 20  P_ANY         2 
0c80: 20 20 20 2f 2a 20 4d 61 74 63 68 20 61 6e 79 20     /* Match any 
0c90: 6f 6e 65 20 63 68 61 72 61 63 74 65 72 2e 20 20  one character.  
0ca0: 28 49 6d 70 6c 65 6d 65 6e 74 73 20 22 2e 22 29  (Implements ".")
0cb0: 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f   */.#define RE_O
0cc0: 50 5f 41 4e 59 53 54 41 52 20 20 20 20 20 33 20  P_ANYSTAR     3 
0cd0: 20 20 20 2f 2a 20 53 70 65 63 69 61 6c 20 6f 70     /* Special op
0ce0: 74 69 6d 69 7a 65 64 20 76 65 72 73 69 6f 6e 20  timized version 
0cf0: 6f 66 20 2e 2a 20 2a 2f 0a 23 64 65 66 69 6e 65  of .* */.#define
0d00: 20 52 45 5f 4f 50 5f 46 4f 52 4b 20 20 20 20 20   RE_OP_FORK     
0d10: 20 20 20 34 20 20 20 20 2f 2a 20 43 6f 6e 74 69     4    /* Conti
0d20: 6e 75 65 20 74 6f 20 62 6f 74 68 20 6e 65 78 74  nue to both next
0d30: 20 61 6e 64 20 6f 70 63 6f 64 65 20 61 74 20 69   and opcode at i
0d40: 41 72 67 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  Arg */.#define R
0d50: 45 5f 4f 50 5f 47 4f 54 4f 20 20 20 20 20 20 20  E_OP_GOTO       
0d60: 20 35 20 20 20 20 2f 2a 20 4a 75 6d 70 20 74 6f   5    /* Jump to
0d70: 20 6f 70 63 6f 64 65 20 61 74 20 69 41 72 67 20   opcode at iArg 
0d80: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50  */.#define RE_OP
0d90: 5f 41 43 43 45 50 54 20 20 20 20 20 20 36 20 20  _ACCEPT      6  
0da0: 20 20 2f 2a 20 48 61 6c 74 20 61 6e 64 20 69 6e    /* Halt and in
0db0: 64 69 63 61 74 65 20 61 20 73 75 63 63 65 73 73  dicate a success
0dc0: 66 75 6c 20 6d 61 74 63 68 20 2a 2f 0a 23 64 65  ful match */.#de
0dd0: 66 69 6e 65 20 52 45 5f 4f 50 5f 43 43 5f 49 4e  fine RE_OP_CC_IN
0de0: 43 20 20 20 20 20 20 37 20 20 20 20 2f 2a 20 42  C      7    /* B
0df0: 65 67 69 6e 6e 69 6e 67 20 6f 66 20 61 20 5b 2e  eginning of a [.
0e00: 2e 2e 5d 20 63 68 61 72 61 63 74 65 72 20 63 6c  ..] character cl
0e10: 61 73 73 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  ass */.#define R
0e20: 45 5f 4f 50 5f 43 43 5f 45 58 43 20 20 20 20 20  E_OP_CC_EXC     
0e30: 20 38 20 20 20 20 2f 2a 20 42 65 67 69 6e 6e 69   8    /* Beginni
0e40: 6e 67 20 6f 66 20 61 20 5b 5e 2e 2e 2e 5d 20 63  ng of a [^...] c
0e50: 68 61 72 61 63 74 65 72 20 63 6c 61 73 73 20 2a  haracter class *
0e60: 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f  /.#define RE_OP_
0e70: 43 43 5f 56 41 4c 55 45 20 20 20 20 39 20 20 20  CC_VALUE    9   
0e80: 20 2f 2a 20 53 69 6e 67 6c 65 20 76 61 6c 75 65   /* Single value
0e90: 20 69 6e 20 61 20 63 68 61 72 61 63 74 65 72 20   in a character 
0ea0: 63 6c 61 73 73 20 2a 2f 0a 23 64 65 66 69 6e 65  class */.#define
0eb0: 20 52 45 5f 4f 50 5f 43 43 5f 52 41 4e 47 45 20   RE_OP_CC_RANGE 
0ec0: 20 20 31 30 20 20 20 20 2f 2a 20 52 61 6e 67 65    10    /* Range
0ed0: 20 6f 66 20 76 61 6c 75 65 73 20 69 6e 20 61 20   of values in a 
0ee0: 63 68 61 72 61 63 74 65 72 20 63 6c 61 73 73 20  character class 
0ef0: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50  */.#define RE_OP
0f00: 5f 57 4f 52 44 20 20 20 20 20 20 20 31 31 20 20  _WORD       11  
0f10: 20 20 2f 2a 20 50 65 72 6c 20 77 6f 72 64 20 63    /* Perl word c
0f20: 68 61 72 61 63 74 65 72 20 5b 41 2d 5a 61 2d 7a  haracter [A-Za-z
0f30: 30 2d 39 5f 5d 20 2a 2f 0a 23 64 65 66 69 6e 65  0-9_] */.#define
0f40: 20 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 20 20   RE_OP_NOTWORD  
0f50: 20 20 31 32 20 20 20 20 2f 2a 20 4e 6f 74 20 61    12    /* Not a
0f60: 20 70 65 72 6c 20 77 6f 72 64 20 63 68 61 72 61   perl word chara
0f70: 63 74 65 72 20 2a 2f 0a 23 64 65 66 69 6e 65 20  cter */.#define 
0f80: 52 45 5f 4f 50 5f 44 49 47 49 54 20 20 20 20 20  RE_OP_DIGIT     
0f90: 20 31 33 20 20 20 20 2f 2a 20 64 69 67 69 74 3a   13    /* digit:
0fa0: 20 20 5b 30 2d 39 5d 20 2a 2f 0a 23 64 65 66 69    [0-9] */.#defi
0fb0: 6e 65 20 52 45 5f 4f 50 5f 4e 4f 54 44 49 47 49  ne RE_OP_NOTDIGI
0fc0: 54 20 20 20 31 34 20 20 20 20 2f 2a 20 4e 6f 74  T   14    /* Not
0fd0: 20 61 20 64 69 67 69 74 20 2a 2f 0a 23 64 65 66   a digit */.#def
0fe0: 69 6e 65 20 52 45 5f 4f 50 5f 53 50 41 43 45 20  ine RE_OP_SPACE 
0ff0: 20 20 20 20 20 31 35 20 20 20 20 2f 2a 20 73 70       15    /* sp
1000: 61 63 65 3a 20 20 5b 20 5c 74 5c 6e 5c 72 5c 76  ace:  [ \t\n\r\v
1010: 5c 66 5d 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  \f] */.#define R
1020: 45 5f 4f 50 5f 4e 4f 54 53 50 41 43 45 20 20 20  E_OP_NOTSPACE   
1030: 31 36 20 20 20 20 2f 2a 20 4e 6f 74 20 61 20 64  16    /* Not a d
1040: 69 67 69 74 20 2a 2f 0a 23 64 65 66 69 6e 65 20  igit */.#define 
1050: 52 45 5f 4f 50 5f 42 4f 55 4e 44 41 52 59 20 20  RE_OP_BOUNDARY  
1060: 20 31 37 20 20 20 20 2f 2a 20 42 6f 75 6e 64 61   17    /* Bounda
1070: 72 79 20 62 65 74 77 65 65 6e 20 77 6f 72 64 20  ry between word 
1080: 61 6e 64 20 6e 6f 6e 2d 77 6f 72 64 20 2a 2f 0a  and non-word */.
1090: 0a 2f 2a 20 45 61 63 68 20 6f 70 63 6f 64 65 20  ./* Each opcode 
10a0: 69 73 20 61 20 22 73 74 61 74 65 22 20 69 6e 20  is a "state" in 
10b0: 74 68 65 20 4e 46 41 20 2a 2f 0a 74 79 70 65 64  the NFA */.typed
10c0: 65 66 20 75 6e 73 69 67 6e 65 64 20 73 68 6f 72  ef unsigned shor
10d0: 74 20 52 65 53 74 61 74 65 4e 75 6d 62 65 72 3b  t ReStateNumber;
10e0: 0a 0a 2f 2a 20 42 65 63 61 75 73 65 20 74 68 69  ../* Because thi
10f0: 73 20 69 73 20 61 6e 20 4e 46 41 20 61 6e 64 20  s is an NFA and 
1100: 6e 6f 74 20 61 20 44 46 41 2c 20 6d 75 6c 74 69  not a DFA, multi
1110: 70 6c 65 20 73 74 61 74 65 73 20 63 61 6e 20 62  ple states can b
1120: 65 20 61 63 74 69 76 65 20 61 74 0a 2a 2a 20 6f  e active at.** o
1130: 6e 63 65 2e 20 20 41 6e 20 69 6e 73 74 61 6e 63  nce.  An instanc
1140: 65 20 6f 66 20 74 68 65 20 66 6f 6c 6c 6f 77 69  e of the followi
1150: 6e 67 20 6f 62 6a 65 63 74 20 72 65 63 6f 72 64  ng object record
1160: 73 20 61 6c 6c 20 61 63 74 69 76 65 20 73 74 61  s all active sta
1170: 74 65 73 20 69 6e 0a 2a 2a 20 74 68 65 20 4e 46  tes in.** the NF
1180: 41 2e 20 20 54 68 65 20 69 6d 70 6c 65 6d 65 6e  A.  The implemen
1190: 74 61 74 69 6f 6e 20 69 73 20 6f 70 74 69 6d 69  tation is optimi
11a0: 7a 65 64 20 66 6f 72 20 74 68 65 20 63 6f 6d 6d  zed for the comm
11b0: 6f 6e 20 63 61 73 65 20 77 68 65 72 65 20 74 68  on case where th
11c0: 65 0a 2a 2a 20 6e 75 6d 62 65 72 20 6f 66 20 61  e.** number of a
11d0: 63 74 69 76 65 73 20 73 74 61 74 65 73 20 69 73  ctives states is
11e0: 20 73 6d 61 6c 6c 2e 0a 2a 2f 0a 74 79 70 65 64   small..*/.typed
11f0: 65 66 20 73 74 72 75 63 74 20 52 65 53 74 61 74  ef struct ReStat
1200: 65 53 65 74 20 7b 0a 20 20 75 6e 73 69 67 6e 65  eSet {.  unsigne
1210: 64 20 6e 53 74 61 74 65 3b 20 20 20 20 20 20 20  d nState;       
1220: 20 20 20 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f       /* Number o
1230: 66 20 63 75 72 72 65 6e 74 20 73 74 61 74 65 73  f current states
1240: 20 2a 2f 0a 20 20 52 65 53 74 61 74 65 4e 75 6d   */.  ReStateNum
1250: 62 65 72 20 2a 61 53 74 61 74 65 3b 20 20 20 20  ber *aState;    
1260: 20 20 2f 2a 20 43 75 72 72 65 6e 74 20 73 74 61    /* Current sta
1270: 74 65 73 20 2a 2f 0a 7d 20 52 65 53 74 61 74 65  tes */.} ReState
1280: 53 65 74 3b 0a 0a 2f 2a 20 41 6e 20 69 6e 70 75  Set;../* An inpu
1290: 74 20 73 74 72 69 6e 67 20 72 65 61 64 20 6f 6e  t string read on
12a0: 65 20 63 68 61 72 61 63 74 65 72 20 61 74 20 61  e character at a
12b0: 20 74 69 6d 65 2e 0a 2a 2f 0a 74 79 70 65 64 65   time..*/.typede
12c0: 66 20 73 74 72 75 63 74 20 52 65 49 6e 70 75 74  f struct ReInput
12d0: 20 52 65 49 6e 70 75 74 3b 0a 73 74 72 75 63 74   ReInput;.struct
12e0: 20 52 65 49 6e 70 75 74 20 7b 0a 20 20 63 6f 6e   ReInput {.  con
12f0: 73 74 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72  st unsigned char
1300: 20 2a 7a 3b 20 20 2f 2a 20 41 6c 6c 20 74 65 78   *z;  /* All tex
1310: 74 20 2a 2f 0a 20 20 69 6e 74 20 69 3b 20 20 20  t */.  int i;   
1320: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1330: 2f 2a 20 4e 65 78 74 20 62 79 74 65 20 74 6f 20  /* Next byte to 
1340: 72 65 61 64 20 2a 2f 0a 20 20 69 6e 74 20 6d 78  read */.  int mx
1350: 3b 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ;               
1360: 20 20 20 2f 2a 20 45 4f 46 20 77 68 65 6e 20 69     /* EOF when i
1370: 3e 3d 6d 78 20 2a 2f 0a 7d 3b 0a 0a 2f 2a 20 41  >=mx */.};../* A
1380: 20 63 6f 6d 70 69 6c 65 64 20 4e 46 41 20 28 6f   compiled NFA (o
1390: 72 20 61 6e 20 4e 46 41 20 74 68 61 74 20 69 73  r an NFA that is
13a0: 20 69 6e 20 74 68 65 20 70 72 6f 63 65 73 73 20   in the process 
13b0: 6f 66 20 62 65 69 6e 67 20 63 6f 6d 70 69 6c 65  of being compile
13c0: 64 29 20 69 73 0a 2a 2a 20 61 6e 20 69 6e 73 74  d) is.** an inst
13d0: 61 6e 63 65 20 6f 66 20 74 68 65 20 66 6f 6c 6c  ance of the foll
13e0: 6f 77 69 6e 67 20 6f 62 6a 65 63 74 2e 0a 2a 2f  owing object..*/
13f0: 0a 74 79 70 65 64 65 66 20 73 74 72 75 63 74 20  .typedef struct 
1400: 52 65 43 6f 6d 70 69 6c 65 64 20 52 65 43 6f 6d  ReCompiled ReCom
1410: 70 69 6c 65 64 3b 0a 73 74 72 75 63 74 20 52 65  piled;.struct Re
1420: 43 6f 6d 70 69 6c 65 64 20 7b 0a 20 20 52 65 49  Compiled {.  ReI
1430: 6e 70 75 74 20 73 49 6e 3b 20 20 20 20 20 20 20  nput sIn;       
1440: 20 20 20 20 20 20 20 20 20 2f 2a 20 52 65 67 75           /* Regu
1450: 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20 74  lar expression t
1460: 65 78 74 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63  ext */.  const c
1470: 68 61 72 20 2a 7a 45 72 72 3b 20 20 20 20 20 20  har *zErr;      
1480: 20 20 20 20 20 2f 2a 20 45 72 72 6f 72 20 6d 65       /* Error me
1490: 73 73 61 67 65 20 74 6f 20 72 65 74 75 72 6e 20  ssage to return 
14a0: 2a 2f 0a 20 20 63 68 61 72 20 2a 61 4f 70 3b 20  */.  char *aOp; 
14b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
14c0: 20 2f 2a 20 4f 70 65 72 61 74 6f 72 73 20 66 6f   /* Operators fo
14d0: 72 20 74 68 65 20 76 69 72 74 75 61 6c 20 6d 61  r the virtual ma
14e0: 63 68 69 6e 65 20 2a 2f 0a 20 20 69 6e 74 20 2a  chine */.  int *
14f0: 61 41 72 67 3b 20 20 20 20 20 20 20 20 20 20 20  aArg;           
1500: 20 20 20 20 20 20 20 2f 2a 20 41 72 67 75 6d 65         /* Argume
1510: 6e 74 73 20 74 6f 20 65 61 63 68 20 6f 70 65 72  nts to each oper
1520: 61 74 6f 72 20 2a 2f 0a 20 20 75 6e 73 69 67 6e  ator */.  unsign
1530: 65 64 20 28 2a 78 4e 65 78 74 43 68 61 72 29 28  ed (*xNextChar)(
1540: 52 65 49 6e 70 75 74 2a 29 3b 20 20 2f 2a 20 4e  ReInput*);  /* N
1550: 65 78 74 20 63 68 61 72 61 63 74 65 72 20 66 75  ext character fu
1560: 6e 63 74 69 6f 6e 20 2a 2f 0a 20 20 75 6e 73 69  nction */.  unsi
1570: 67 6e 65 64 20 63 68 61 72 20 7a 49 6e 69 74 5b  gned char zInit[
1580: 31 32 5d 3b 20 20 20 20 2f 2a 20 49 6e 69 74 69  12];    /* Initi
1590: 61 6c 20 74 65 78 74 20 74 6f 20 6d 61 74 63 68  al text to match
15a0: 20 2a 2f 0a 20 20 69 6e 74 20 6e 49 6e 69 74 3b   */.  int nInit;
15b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
15c0: 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f 66 20 63    /* Number of c
15d0: 68 61 72 61 63 74 65 72 73 20 69 6e 20 7a 49 6e  haracters in zIn
15e0: 69 74 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64  it */.  unsigned
15f0: 20 6e 53 74 61 74 65 3b 20 20 20 20 20 20 20 20   nState;        
1600: 20 20 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f 66      /* Number of
1610: 20 65 6e 74 72 69 65 73 20 69 6e 20 61 4f 70 5b   entries in aOp[
1620: 5d 20 61 6e 64 20 61 41 72 67 5b 5d 20 2a 2f 0a  ] and aArg[] */.
1630: 20 20 75 6e 73 69 67 6e 65 64 20 6e 41 6c 6c 6f    unsigned nAllo
1640: 63 3b 20 20 20 20 20 20 20 20 20 20 20 20 2f 2a  c;            /*
1650: 20 53 6c 6f 74 73 20 61 6c 6c 6f 63 61 74 65 64   Slots allocated
1660: 20 66 6f 72 20 61 4f 70 5b 5d 20 61 6e 64 20 61   for aOp[] and a
1670: 41 72 67 5b 5d 20 2a 2f 0a 7d 3b 0a 0a 2f 2a 20  Arg[] */.};../* 
1680: 41 64 64 20 61 20 73 74 61 74 65 20 74 6f 20 74  Add a state to t
1690: 68 65 20 67 69 76 65 6e 20 73 74 61 74 65 20 73  he given state s
16a0: 65 74 20 69 66 20 69 74 20 69 73 20 6e 6f 74 20  et if it is not 
16b0: 61 6c 72 65 61 64 79 20 74 68 65 72 65 20 2a 2f  already there */
16c0: 0a 73 74 61 74 69 63 20 76 6f 69 64 20 72 65 5f  .static void re_
16d0: 61 64 64 5f 73 74 61 74 65 28 52 65 53 74 61 74  add_state(ReStat
16e0: 65 53 65 74 20 2a 70 53 65 74 2c 20 69 6e 74 20  eSet *pSet, int 
16f0: 6e 65 77 53 74 61 74 65 29 7b 0a 20 20 75 6e 73  newState){.  uns
1700: 69 67 6e 65 64 20 69 3b 0a 20 20 66 6f 72 28 69  igned i;.  for(i
1710: 3d 30 3b 20 69 3c 70 53 65 74 2d 3e 6e 53 74 61  =0; i<pSet->nSta
1720: 74 65 3b 20 69 2b 2b 29 20 69 66 28 20 70 53 65  te; i++) if( pSe
1730: 74 2d 3e 61 53 74 61 74 65 5b 69 5d 3d 3d 6e 65  t->aState[i]==ne
1740: 77 53 74 61 74 65 20 29 20 72 65 74 75 72 6e 3b  wState ) return;
1750: 0a 20 20 70 53 65 74 2d 3e 61 53 74 61 74 65 5b  .  pSet->aState[
1760: 70 53 65 74 2d 3e 6e 53 74 61 74 65 2b 2b 5d 20  pSet->nState++] 
1770: 3d 20 6e 65 77 53 74 61 74 65 3b 0a 7d 0a 0a 2f  = newState;.}../
1780: 2a 20 45 78 74 72 61 63 74 20 74 68 65 20 6e 65  * Extract the ne
1790: 78 74 20 75 6e 69 63 6f 64 65 20 63 68 61 72 61  xt unicode chara
17a0: 63 74 65 72 20 66 72 6f 6d 20 2a 70 7a 49 6e 20  cter from *pzIn 
17b0: 61 6e 64 20 72 65 74 75 72 6e 20 69 74 2e 20 20  and return it.  
17c0: 41 64 76 61 6e 63 65 0a 2a 2a 20 2a 70 7a 49 6e  Advance.** *pzIn
17d0: 20 74 6f 20 74 68 65 20 66 69 72 73 74 20 62 79   to the first by
17e0: 74 65 20 70 61 73 74 20 74 68 65 20 65 6e 64 20  te past the end 
17f0: 6f 66 20 74 68 65 20 63 68 61 72 61 63 74 65 72  of the character
1800: 20 72 65 74 75 72 6e 65 64 2e 20 20 54 6f 0a 2a   returned.  To.*
1810: 2a 20 62 65 20 63 6c 65 61 72 3a 20 20 74 68 69  * be clear:  thi
1820: 73 20 72 6f 75 74 69 6e 65 20 63 6f 6e 76 65 72  s routine conver
1830: 74 73 20 75 74 66 38 20 74 6f 20 75 6e 69 63 6f  ts utf8 to unico
1840: 64 65 2e 20 20 54 68 69 73 20 72 6f 75 74 69 6e  de.  This routin
1850: 65 20 69 73 20 0a 2a 2a 20 6f 70 74 69 6d 69 7a  e is .** optimiz
1860: 65 64 20 66 6f 72 20 74 68 65 20 63 6f 6d 6d 6f  ed for the commo
1870: 6e 20 63 61 73 65 20 77 68 65 72 65 20 74 68 65  n case where the
1880: 20 6e 65 78 74 20 63 68 61 72 61 63 74 65 72 20   next character 
1890: 69 73 20 61 20 73 69 6e 67 6c 65 20 62 79 74 65  is a single byte
18a0: 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e 73 69  ..*/.static unsi
18b0: 67 6e 65 64 20 72 65 5f 6e 65 78 74 5f 63 68 61  gned re_next_cha
18c0: 72 28 52 65 49 6e 70 75 74 20 2a 70 29 7b 0a 20  r(ReInput *p){. 
18d0: 20 75 6e 73 69 67 6e 65 64 20 63 3b 0a 20 20 69   unsigned c;.  i
18e0: 66 28 20 70 2d 3e 69 3e 3d 70 2d 3e 6d 78 20 29  f( p->i>=p->mx )
18f0: 20 72 65 74 75 72 6e 20 30 3b 0a 20 20 63 20 3d   return 0;.  c =
1900: 20 70 2d 3e 7a 5b 70 2d 3e 69 2b 2b 5d 3b 0a 20   p->z[p->i++];. 
1910: 20 69 66 28 20 63 3e 3d 30 78 38 30 20 29 7b 0a   if( c>=0x80 ){.
1920: 20 20 20 20 69 66 28 20 28 63 26 30 78 65 30 29      if( (c&0xe0)
1930: 3d 3d 30 78 63 30 20 26 26 20 70 2d 3e 69 3c 70  ==0xc0 && p->i<p
1940: 2d 3e 6d 78 20 26 26 20 28 70 2d 3e 7a 5b 70 2d  ->mx && (p->z[p-
1950: 3e 69 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 20  >i]&0xc0)==0x80 
1960: 29 7b 0a 20 20 20 20 20 20 63 20 3d 20 28 63 26  ){.      c = (c&
1970: 30 78 31 66 29 3c 3c 36 20 7c 20 28 70 2d 3e 7a  0x1f)<<6 | (p->z
1980: 5b 70 2d 3e 69 2b 2b 5d 26 30 78 33 66 29 3b 0a  [p->i++]&0x3f);.
1990: 20 20 20 20 20 20 69 66 28 20 63 3c 30 78 38 30        if( c<0x80
19a0: 20 29 20 63 20 3d 20 30 78 66 66 66 64 3b 0a 20   ) c = 0xfffd;. 
19b0: 20 20 20 7d 65 6c 73 65 20 69 66 28 20 28 63 26     }else if( (c&
19c0: 30 78 66 30 29 3d 3d 30 78 65 30 20 26 26 20 70  0xf0)==0xe0 && p
19d0: 2d 3e 69 2b 31 3c 70 2d 3e 6d 78 20 26 26 20 28  ->i+1<p->mx && (
19e0: 70 2d 3e 7a 5b 70 2d 3e 69 5d 26 30 78 63 30 29  p->z[p->i]&0xc0)
19f0: 3d 3d 30 78 38 30 0a 20 20 20 20 20 20 20 20 20  ==0x80.         
1a00: 20 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b    && (p->z[p->i+
1a10: 31 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 20 29  1]&0xc0)==0x80 )
1a20: 7b 0a 20 20 20 20 20 20 63 20 3d 20 28 63 26 30  {.      c = (c&0
1a30: 78 30 66 29 3c 3c 31 32 20 7c 20 28 28 70 2d 3e  x0f)<<12 | ((p->
1a40: 7a 5b 70 2d 3e 69 5d 26 30 78 33 66 29 3c 3c 36  z[p->i]&0x3f)<<6
1a50: 29 20 7c 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 31  ) | (p->z[p->i+1
1a60: 5d 26 30 78 33 66 29 3b 0a 20 20 20 20 20 20 70  ]&0x3f);.      p
1a70: 2d 3e 69 20 2b 3d 20 32 3b 0a 20 20 20 20 20 20  ->i += 2;.      
1a80: 69 66 28 20 63 3c 3d 30 78 33 66 66 20 7c 7c 20  if( c<=0x3ff || 
1a90: 28 63 3e 3d 30 78 64 38 30 30 20 26 26 20 63 3c  (c>=0xd800 && c<
1aa0: 3d 30 78 64 66 66 66 29 20 29 20 63 20 3d 20 30  =0xdfff) ) c = 0
1ab0: 78 66 66 66 64 3b 0a 20 20 20 20 7d 65 6c 73 65  xfffd;.    }else
1ac0: 20 69 66 28 20 28 63 26 30 78 66 38 29 3d 3d 30   if( (c&0xf8)==0
1ad0: 78 66 30 20 26 26 20 70 2d 3e 69 2b 33 3c 70 2d  xf0 && p->i+3<p-
1ae0: 3e 6d 78 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e  >mx && (p->z[p->
1af0: 69 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 0a 20  i]&0xc0)==0x80. 
1b00: 20 20 20 20 20 20 20 20 20 20 26 26 20 28 70 2d            && (p-
1b10: 3e 7a 5b 70 2d 3e 69 2b 31 5d 26 30 78 63 30 29  >z[p->i+1]&0xc0)
1b20: 3d 3d 30 78 38 30 20 26 26 20 28 70 2d 3e 7a 5b  ==0x80 && (p->z[
1b30: 70 2d 3e 69 2b 32 5d 26 30 78 63 30 29 3d 3d 30  p->i+2]&0xc0)==0
1b40: 78 38 30 20 29 7b 0a 20 20 20 20 20 20 63 20 3d  x80 ){.      c =
1b50: 20 28 63 26 30 78 30 37 29 3c 3c 31 38 20 7c 20   (c&0x07)<<18 | 
1b60: 28 28 70 2d 3e 7a 5b 70 2d 3e 69 5d 26 30 78 33  ((p->z[p->i]&0x3
1b70: 66 29 3c 3c 31 32 29 20 7c 20 28 28 70 2d 3e 7a  f)<<12) | ((p->z
1b80: 5b 70 2d 3e 69 2b 31 5d 26 30 78 33 66 29 3c 3c  [p->i+1]&0x3f)<<
1b90: 36 29 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  6).             
1ba0: 20 20 20 20 20 20 20 20 20 20 7c 20 28 70 2d 3e            | (p->
1bb0: 7a 5b 70 2d 3e 69 2b 32 5d 26 30 78 33 66 29 3b  z[p->i+2]&0x3f);
1bc0: 0a 20 20 20 20 20 20 70 2d 3e 69 20 2b 3d 20 33  .      p->i += 3
1bd0: 3b 0a 20 20 20 20 20 20 69 66 28 20 63 3c 3d 30  ;.      if( c<=0
1be0: 78 66 66 66 66 20 7c 7c 20 63 3e 30 78 31 30 66  xffff || c>0x10f
1bf0: 66 66 66 20 29 20 63 20 3d 20 30 78 66 66 66 64  fff ) c = 0xfffd
1c00: 3b 0a 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20  ;.    }else{.   
1c10: 20 20 20 63 20 3d 20 30 78 66 66 66 64 3b 0a 20     c = 0xfffd;. 
1c20: 20 20 20 7d 0a 20 20 7d 0a 20 20 72 65 74 75 72     }.  }.  retur
1c30: 6e 20 63 3b 0a 7d 0a 73 74 61 74 69 63 20 75 6e  n c;.}.static un
1c40: 73 69 67 6e 65 64 20 72 65 5f 6e 65 78 74 5f 63  signed re_next_c
1c50: 68 61 72 5f 6e 6f 63 61 73 65 28 52 65 49 6e 70  har_nocase(ReInp
1c60: 75 74 20 2a 70 29 7b 0a 20 20 75 6e 73 69 67 6e  ut *p){.  unsign
1c70: 65 64 20 63 20 3d 20 72 65 5f 6e 65 78 74 5f 63  ed c = re_next_c
1c80: 68 61 72 28 70 29 3b 0a 20 20 69 66 28 20 63 3e  har(p);.  if( c>
1c90: 3d 27 41 27 20 26 26 20 63 3c 3d 27 5a 27 20 29  ='A' && c<='Z' )
1ca0: 20 63 20 2b 3d 20 27 61 27 20 2d 20 27 41 27 3b   c += 'a' - 'A';
1cb0: 0a 20 20 72 65 74 75 72 6e 20 63 3b 0a 7d 0a 0a  .  return c;.}..
1cc0: 2f 2a 20 52 65 74 75 72 6e 20 74 72 75 65 20 69  /* Return true i
1cd0: 66 20 63 20 69 73 20 61 20 70 65 72 6c 20 22 77  f c is a perl "w
1ce0: 6f 72 64 22 20 63 68 61 72 61 63 74 65 72 3a 20  ord" character: 
1cf0: 20 5b 41 2d 5a 61 2d 7a 30 2d 39 5f 5d 20 2a 2f   [A-Za-z0-9_] */
1d00: 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 77  .static int re_w
1d10: 6f 72 64 5f 63 68 61 72 28 69 6e 74 20 63 29 7b  ord_char(int c){
1d20: 0a 20 20 72 65 74 75 72 6e 20 28 63 3e 3d 27 30  .  return (c>='0
1d30: 27 20 26 26 20 63 3c 3d 27 39 27 29 20 7c 7c 20  ' && c<='9') || 
1d40: 28 63 3e 3d 27 61 27 20 26 26 20 63 3c 3d 27 7a  (c>='a' && c<='z
1d50: 27 29 0a 20 20 20 20 20 20 7c 7c 20 28 63 3e 3d  ').      || (c>=
1d60: 27 41 27 20 26 26 20 63 3c 3d 27 5a 27 29 20 7c  'A' && c<='Z') |
1d70: 7c 20 63 3d 3d 27 5f 27 3b 0a 7d 0a 0a 2f 2a 20  | c=='_';.}../* 
1d80: 52 65 74 75 72 6e 20 74 72 75 65 20 69 66 20 63  Return true if c
1d90: 20 69 73 20 61 20 22 64 69 67 69 74 22 20 63 68   is a "digit" ch
1da0: 61 72 61 63 74 65 72 3a 20 20 5b 30 2d 39 5d 20  aracter:  [0-9] 
1db0: 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65  */.static int re
1dc0: 5f 64 69 67 69 74 5f 63 68 61 72 28 69 6e 74 20  _digit_char(int 
1dd0: 63 29 7b 0a 20 20 72 65 74 75 72 6e 20 28 63 3e  c){.  return (c>
1de0: 3d 27 30 27 20 26 26 20 63 3c 3d 27 39 27 29 3b  ='0' && c<='9');
1df0: 0a 7d 0a 0a 2f 2a 20 52 65 74 75 72 6e 20 74 72  .}../* Return tr
1e00: 75 65 20 69 66 20 63 20 69 73 20 61 20 70 65 72  ue if c is a per
1e10: 6c 20 22 73 70 61 63 65 22 20 63 68 61 72 61 63  l "space" charac
1e20: 74 65 72 3a 20 20 5b 20 5c 74 5c 72 5c 6e 5c 76  ter:  [ \t\r\n\v
1e30: 5c 66 5d 20 2a 2f 0a 73 74 61 74 69 63 20 69 6e  \f] */.static in
1e40: 74 20 72 65 5f 73 70 61 63 65 5f 63 68 61 72 28  t re_space_char(
1e50: 69 6e 74 20 63 29 7b 0a 20 20 72 65 74 75 72 6e  int c){.  return
1e60: 20 63 3d 3d 27 20 27 20 7c 7c 20 63 3d 3d 27 5c   c==' ' || c=='\
1e70: 74 27 20 7c 7c 20 63 3d 3d 27 5c 6e 27 20 7c 7c  t' || c=='\n' ||
1e80: 20 63 3d 3d 27 5c 72 27 20 7c 7c 20 63 3d 3d 27   c=='\r' || c=='
1e90: 5c 76 27 20 7c 7c 20 63 3d 3d 27 5c 66 27 3b 0a  \v' || c=='\f';.
1ea0: 7d 0a 0a 2f 2a 20 52 75 6e 20 61 20 63 6f 6d 70  }../* Run a comp
1eb0: 69 6c 65 64 20 72 65 67 75 6c 61 72 20 65 78 70  iled regular exp
1ec0: 72 65 73 73 69 6f 6e 20 6f 6e 20 74 68 65 20 7a  ression on the z
1ed0: 65 72 6f 2d 74 65 72 6d 69 6e 61 74 65 64 20 69  ero-terminated i
1ee0: 6e 70 75 74 0a 2a 2a 20 73 74 72 69 6e 67 20 7a  nput.** string z
1ef0: 49 6e 5b 5d 2e 20 20 52 65 74 75 72 6e 20 74 72  In[].  Return tr
1f00: 75 65 20 6f 6e 20 61 20 6d 61 74 63 68 20 61 6e  ue on a match an
1f10: 64 20 66 61 6c 73 65 20 69 66 20 74 68 65 72 65  d false if there
1f20: 20 69 73 20 6e 6f 20 6d 61 74 63 68 2e 0a 2a 2f   is no match..*/
1f30: 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 6d  .static int re_m
1f40: 61 74 63 68 28 52 65 43 6f 6d 70 69 6c 65 64 20  atch(ReCompiled 
1f50: 2a 70 52 65 2c 20 63 6f 6e 73 74 20 75 6e 73 69  *pRe, const unsi
1f60: 67 6e 65 64 20 63 68 61 72 20 2a 7a 49 6e 2c 20  gned char *zIn, 
1f70: 69 6e 74 20 6e 49 6e 29 7b 0a 20 20 52 65 53 74  int nIn){.  ReSt
1f80: 61 74 65 53 65 74 20 61 53 74 61 74 65 53 65 74  ateSet aStateSet
1f90: 5b 32 5d 2c 20 2a 70 54 68 69 73 2c 20 2a 70 4e  [2], *pThis, *pN
1fa0: 65 78 74 3b 0a 20 20 52 65 53 74 61 74 65 4e 75  ext;.  ReStateNu
1fb0: 6d 62 65 72 20 61 53 70 61 63 65 5b 31 30 30 5d  mber aSpace[100]
1fc0: 3b 0a 20 20 52 65 53 74 61 74 65 4e 75 6d 62 65  ;.  ReStateNumbe
1fd0: 72 20 2a 70 54 6f 46 72 65 65 3b 0a 20 20 75 6e  r *pToFree;.  un
1fe0: 73 69 67 6e 65 64 20 69 6e 74 20 69 20 3d 20 30  signed int i = 0
1ff0: 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74  ;.  unsigned int
2000: 20 69 53 77 61 70 20 3d 20 30 3b 0a 20 20 69 6e   iSwap = 0;.  in
2010: 74 20 63 20 3d 20 52 45 5f 45 4f 46 2b 31 3b 0a  t c = RE_EOF+1;.
2020: 20 20 69 6e 74 20 63 50 72 65 76 20 3d 20 30 3b    int cPrev = 0;
2030: 0a 20 20 69 6e 74 20 72 63 20 3d 20 30 3b 0a 20  .  int rc = 0;. 
2040: 20 52 65 49 6e 70 75 74 20 69 6e 3b 0a 0a 20 20   ReInput in;..  
2050: 69 6e 2e 7a 20 3d 20 7a 49 6e 3b 0a 20 20 69 6e  in.z = zIn;.  in
2060: 2e 69 20 3d 20 30 3b 0a 20 20 69 6e 2e 6d 78 20  .i = 0;.  in.mx 
2070: 3d 20 6e 49 6e 3e 3d 30 20 3f 20 6e 49 6e 20 3a  = nIn>=0 ? nIn :
2080: 20 28 69 6e 74 29 73 74 72 6c 65 6e 28 28 63 68   (int)strlen((ch
2090: 61 72 20 63 6f 6e 73 74 2a 29 7a 49 6e 29 3b 0a  ar const*)zIn);.
20a0: 0a 20 20 2f 2a 20 4c 6f 6f 6b 20 66 6f 72 20 74  .  /* Look for t
20b0: 68 65 20 69 6e 69 74 69 61 6c 20 70 72 65 66 69  he initial prefi
20c0: 78 20 6d 61 74 63 68 2c 20 69 66 20 74 68 65 72  x match, if ther
20d0: 65 20 69 73 20 6f 6e 65 2e 20 2a 2f 0a 20 20 69  e is one. */.  i
20e0: 66 28 20 70 52 65 2d 3e 6e 49 6e 69 74 20 29 7b  f( pRe->nInit ){
20f0: 0a 20 20 20 20 75 6e 73 69 67 6e 65 64 20 63 68  .    unsigned ch
2100: 61 72 20 78 20 3d 20 70 52 65 2d 3e 7a 49 6e 69  ar x = pRe->zIni
2110: 74 5b 30 5d 3b 0a 20 20 20 20 77 68 69 6c 65 28  t[0];.    while(
2120: 20 69 6e 2e 69 2b 70 52 65 2d 3e 6e 49 6e 69 74   in.i+pRe->nInit
2130: 3c 3d 69 6e 2e 6d 78 20 0a 20 20 20 20 20 26 26  <=in.mx .     &&
2140: 20 28 7a 49 6e 5b 69 6e 2e 69 5d 21 3d 78 20 7c   (zIn[in.i]!=x |
2150: 7c 0a 20 20 20 20 20 20 20 20 20 73 74 72 6e 63  |.         strnc
2160: 6d 70 28 28 63 6f 6e 73 74 20 63 68 61 72 2a 29  mp((const char*)
2170: 7a 49 6e 2b 69 6e 2e 69 2c 20 28 63 6f 6e 73 74  zIn+in.i, (const
2180: 20 63 68 61 72 2a 29 70 52 65 2d 3e 7a 49 6e 69   char*)pRe->zIni
2190: 74 2c 20 70 52 65 2d 3e 6e 49 6e 69 74 29 21 3d  t, pRe->nInit)!=
21a0: 30 29 0a 20 20 20 20 29 7b 0a 20 20 20 20 20 20  0).    ){.      
21b0: 69 6e 2e 69 2b 2b 3b 0a 20 20 20 20 7d 0a 20 20  in.i++;.    }.  
21c0: 20 20 69 66 28 20 69 6e 2e 69 2b 70 52 65 2d 3e    if( in.i+pRe->
21d0: 6e 49 6e 69 74 3e 69 6e 2e 6d 78 20 29 20 72 65  nInit>in.mx ) re
21e0: 74 75 72 6e 20 30 3b 0a 20 20 7d 0a 0a 20 20 69  turn 0;.  }..  i
21f0: 66 28 20 70 52 65 2d 3e 6e 53 74 61 74 65 3c 3d  f( pRe->nState<=
2200: 28 73 69 7a 65 6f 66 28 61 53 70 61 63 65 29 2f  (sizeof(aSpace)/
2210: 28 73 69 7a 65 6f 66 28 61 53 70 61 63 65 5b 30  (sizeof(aSpace[0
2220: 5d 29 2a 32 29 29 20 29 7b 0a 20 20 20 20 70 54  ])*2)) ){.    pT
2230: 6f 46 72 65 65 20 3d 20 30 3b 0a 20 20 20 20 61  oFree = 0;.    a
2240: 53 74 61 74 65 53 65 74 5b 30 5d 2e 61 53 74 61  StateSet[0].aSta
2250: 74 65 20 3d 20 61 53 70 61 63 65 3b 0a 20 20 7d  te = aSpace;.  }
2260: 65 6c 73 65 7b 0a 20 20 20 20 70 54 6f 46 72 65  else{.    pToFre
2270: 65 20 3d 20 73 71 6c 69 74 65 33 5f 6d 61 6c 6c  e = sqlite3_mall
2280: 6f 63 28 20 73 69 7a 65 6f 66 28 52 65 53 74 61  oc( sizeof(ReSta
2290: 74 65 4e 75 6d 62 65 72 29 2a 32 2a 70 52 65 2d  teNumber)*2*pRe-
22a0: 3e 6e 53 74 61 74 65 20 29 3b 0a 20 20 20 20 69  >nState );.    i
22b0: 66 28 20 70 54 6f 46 72 65 65 3d 3d 30 20 29 20  f( pToFree==0 ) 
22c0: 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 61  return -1;.    a
22d0: 53 74 61 74 65 53 65 74 5b 30 5d 2e 61 53 74 61  StateSet[0].aSta
22e0: 74 65 20 3d 20 70 54 6f 46 72 65 65 3b 0a 20 20  te = pToFree;.  
22f0: 7d 0a 20 20 61 53 74 61 74 65 53 65 74 5b 31 5d  }.  aStateSet[1]
2300: 2e 61 53 74 61 74 65 20 3d 20 26 61 53 74 61 74  .aState = &aStat
2310: 65 53 65 74 5b 30 5d 2e 61 53 74 61 74 65 5b 70  eSet[0].aState[p
2320: 52 65 2d 3e 6e 53 74 61 74 65 5d 3b 0a 20 20 70  Re->nState];.  p
2330: 4e 65 78 74 20 3d 20 26 61 53 74 61 74 65 53 65  Next = &aStateSe
2340: 74 5b 31 5d 3b 0a 20 20 70 4e 65 78 74 2d 3e 6e  t[1];.  pNext->n
2350: 53 74 61 74 65 20 3d 20 30 3b 0a 20 20 72 65 5f  State = 0;.  re_
2360: 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c  add_state(pNext,
2370: 20 30 29 3b 0a 20 20 77 68 69 6c 65 28 20 63 21   0);.  while( c!
2380: 3d 52 45 5f 45 4f 46 20 26 26 20 70 4e 65 78 74  =RE_EOF && pNext
2390: 2d 3e 6e 53 74 61 74 65 3e 30 20 29 7b 0a 20 20  ->nState>0 ){.  
23a0: 20 20 63 50 72 65 76 20 3d 20 63 3b 0a 20 20 20    cPrev = c;.   
23b0: 20 63 20 3d 20 70 52 65 2d 3e 78 4e 65 78 74 43   c = pRe->xNextC
23c0: 68 61 72 28 26 69 6e 29 3b 0a 20 20 20 20 70 54  har(&in);.    pT
23d0: 68 69 73 20 3d 20 70 4e 65 78 74 3b 0a 20 20 20  his = pNext;.   
23e0: 20 70 4e 65 78 74 20 3d 20 26 61 53 74 61 74 65   pNext = &aState
23f0: 53 65 74 5b 69 53 77 61 70 5d 3b 0a 20 20 20 20  Set[iSwap];.    
2400: 69 53 77 61 70 20 3d 20 31 20 2d 20 69 53 77 61  iSwap = 1 - iSwa
2410: 70 3b 0a 20 20 20 20 70 4e 65 78 74 2d 3e 6e 53  p;.    pNext->nS
2420: 74 61 74 65 20 3d 20 30 3b 0a 20 20 20 20 66 6f  tate = 0;.    fo
2430: 72 28 69 3d 30 3b 20 69 3c 70 54 68 69 73 2d 3e  r(i=0; i<pThis->
2440: 6e 53 74 61 74 65 3b 20 69 2b 2b 29 7b 0a 20 20  nState; i++){.  
2450: 20 20 20 20 69 6e 74 20 78 20 3d 20 70 54 68 69      int x = pThi
2460: 73 2d 3e 61 53 74 61 74 65 5b 69 5d 3b 0a 20 20  s->aState[i];.  
2470: 20 20 20 20 73 77 69 74 63 68 28 20 70 52 65 2d      switch( pRe-
2480: 3e 61 4f 70 5b 78 5d 20 29 7b 0a 20 20 20 20 20  >aOp[x] ){.     
2490: 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4d 41     case RE_OP_MA
24a0: 54 43 48 3a 20 7b 0a 20 20 20 20 20 20 20 20 20  TCH: {.         
24b0: 20 69 66 28 20 70 52 65 2d 3e 61 41 72 67 5b 78   if( pRe->aArg[x
24c0: 5d 3d 3d 63 20 29 20 72 65 5f 61 64 64 5f 73 74  ]==c ) re_add_st
24d0: 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b  ate(pNext, x+1);
24e0: 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b  .          break
24f0: 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  ;.        }.    
2500: 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 41      case RE_OP_A
2510: 4e 59 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20  NY: {.          
2520: 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65  re_add_state(pNe
2530: 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20  xt, x+1);.      
2540: 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20      break;.     
2550: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73     }.        cas
2560: 65 20 52 45 5f 4f 50 5f 57 4f 52 44 3a 20 7b 0a  e RE_OP_WORD: {.
2570: 20 20 20 20 20 20 20 20 20 20 69 66 28 20 72 65            if( re
2580: 5f 77 6f 72 64 5f 63 68 61 72 28 63 29 20 29 20  _word_char(c) ) 
2590: 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65  re_add_state(pNe
25a0: 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20  xt, x+1);.      
25b0: 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20      break;.     
25c0: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73     }.        cas
25d0: 65 20 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 3a  e RE_OP_NOTWORD:
25e0: 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28   {.          if(
25f0: 20 21 72 65 5f 77 6f 72 64 5f 63 68 61 72 28 63   !re_word_char(c
2600: 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74 65  ) ) re_add_state
2610: 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20  (pNext, x+1);.  
2620: 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20          break;. 
2630: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
2640: 20 63 61 73 65 20 52 45 5f 4f 50 5f 44 49 47 49   case RE_OP_DIGI
2650: 54 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69  T: {.          i
2660: 66 28 20 72 65 5f 64 69 67 69 74 5f 63 68 61 72  f( re_digit_char
2670: 28 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61  (c) ) re_add_sta
2680: 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a  te(pNext, x+1);.
2690: 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b            break;
26a0: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20  .        }.     
26b0: 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4e 4f     case RE_OP_NO
26c0: 54 44 49 47 49 54 3a 20 7b 0a 20 20 20 20 20 20  TDIGIT: {.      
26d0: 20 20 20 20 69 66 28 20 21 72 65 5f 64 69 67 69      if( !re_digi
26e0: 74 5f 63 68 61 72 28 63 29 20 29 20 72 65 5f 61  t_char(c) ) re_a
26f0: 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20  dd_state(pNext, 
2700: 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20  x+1);.          
2710: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d  break;.        }
2720: 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45  .        case RE
2730: 5f 4f 50 5f 53 50 41 43 45 3a 20 7b 0a 20 20 20  _OP_SPACE: {.   
2740: 20 20 20 20 20 20 20 69 66 28 20 72 65 5f 73 70         if( re_sp
2750: 61 63 65 5f 63 68 61 72 28 63 29 20 29 20 72 65  ace_char(c) ) re
2760: 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74  _add_state(pNext
2770: 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20  , x+1);.        
2780: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20    break;.       
2790: 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20   }.        case 
27a0: 52 45 5f 4f 50 5f 4e 4f 54 53 50 41 43 45 3a 20  RE_OP_NOTSPACE: 
27b0: 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20  {.          if( 
27c0: 21 72 65 5f 73 70 61 63 65 5f 63 68 61 72 28 63  !re_space_char(c
27d0: 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74 65  ) ) re_add_state
27e0: 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20  (pNext, x+1);.  
27f0: 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20          break;. 
2800: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
2810: 20 63 61 73 65 20 52 45 5f 4f 50 5f 42 4f 55 4e   case RE_OP_BOUN
2820: 44 41 52 59 3a 20 7b 0a 20 20 20 20 20 20 20 20  DARY: {.        
2830: 20 20 69 66 28 20 72 65 5f 77 6f 72 64 5f 63 68    if( re_word_ch
2840: 61 72 28 63 29 21 3d 72 65 5f 77 6f 72 64 5f 63  ar(c)!=re_word_c
2850: 68 61 72 28 63 50 72 65 76 29 20 29 20 72 65 5f  har(cPrev) ) re_
2860: 61 64 64 5f 73 74 61 74 65 28 70 54 68 69 73 2c  add_state(pThis,
2870: 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20   x+1);.         
2880: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20   break;.        
2890: 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52  }.        case R
28a0: 45 5f 4f 50 5f 41 4e 59 53 54 41 52 3a 20 7b 0a  E_OP_ANYSTAR: {.
28b0: 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 64 64            re_add
28c0: 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20 78 29  _state(pNext, x)
28d0: 3b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61  ;.          re_a
28e0: 64 64 5f 73 74 61 74 65 28 70 54 68 69 73 2c 20  dd_state(pThis, 
28f0: 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20  x+1);.          
2900: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d  break;.        }
2910: 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45  .        case RE
2920: 5f 4f 50 5f 46 4f 52 4b 3a 20 7b 0a 20 20 20 20  _OP_FORK: {.    
2930: 20 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74 61        re_add_sta
2940: 74 65 28 70 54 68 69 73 2c 20 78 2b 70 52 65 2d  te(pThis, x+pRe-
2950: 3e 61 41 72 67 5b 78 5d 29 3b 0a 20 20 20 20 20  >aArg[x]);.     
2960: 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74 61 74       re_add_stat
2970: 65 28 70 54 68 69 73 2c 20 78 2b 31 29 3b 0a 20  e(pThis, x+1);. 
2980: 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a           break;.
2990: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
29a0: 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 47 4f 54    case RE_OP_GOT
29b0: 4f 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 72  O: {.          r
29c0: 65 5f 61 64 64 5f 73 74 61 74 65 28 70 54 68 69  e_add_state(pThi
29d0: 73 2c 20 78 2b 70 52 65 2d 3e 61 41 72 67 5b 78  s, x+pRe->aArg[x
29e0: 5d 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72  ]);.          br
29f0: 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20  eak;.        }. 
2a00: 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f 4f         case RE_O
2a10: 50 5f 41 43 43 45 50 54 3a 20 7b 0a 20 20 20 20  P_ACCEPT: {.    
2a20: 20 20 20 20 20 20 72 63 20 3d 20 31 3b 0a 20 20        rc = 1;.  
2a30: 20 20 20 20 20 20 20 20 67 6f 74 6f 20 72 65 5f          goto re_
2a40: 6d 61 74 63 68 5f 65 6e 64 3b 0a 20 20 20 20 20  match_end;.     
2a50: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73     }.        cas
2a60: 65 20 52 45 5f 4f 50 5f 43 43 5f 49 4e 43 3a 0a  e RE_OP_CC_INC:.
2a70: 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f          case RE_
2a80: 4f 50 5f 43 43 5f 45 58 43 3a 20 7b 0a 20 20 20  OP_CC_EXC: {.   
2a90: 20 20 20 20 20 20 20 69 6e 74 20 6a 20 3d 20 31         int j = 1
2aa0: 3b 0a 20 20 20 20 20 20 20 20 20 20 69 6e 74 20  ;.          int 
2ab0: 6e 20 3d 20 70 52 65 2d 3e 61 41 72 67 5b 78 5d  n = pRe->aArg[x]
2ac0: 3b 0a 20 20 20 20 20 20 20 20 20 20 69 6e 74 20  ;.          int 
2ad0: 68 69 74 20 3d 20 30 3b 0a 20 20 20 20 20 20 20  hit = 0;.       
2ae0: 20 20 20 66 6f 72 28 6a 3d 31 3b 20 6a 3e 30 20     for(j=1; j>0 
2af0: 26 26 20 6a 3c 6e 3b 20 6a 2b 2b 29 7b 0a 20 20  && j<n; j++){.  
2b00: 20 20 20 20 20 20 20 20 20 20 69 66 28 20 70 52            if( pR
2b10: 65 2d 3e 61 4f 70 5b 78 2b 6a 5d 3d 3d 52 45 5f  e->aOp[x+j]==RE_
2b20: 4f 50 5f 43 43 5f 56 41 4c 55 45 20 29 7b 0a 20  OP_CC_VALUE ){. 
2b30: 20 20 20 20 20 20 20 20 20 20 20 20 20 69 66 28               if(
2b40: 20 70 52 65 2d 3e 61 41 72 67 5b 78 2b 6a 5d 3d   pRe->aArg[x+j]=
2b50: 3d 63 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20  =c ){.          
2b60: 20 20 20 20 20 20 68 69 74 20 3d 20 31 3b 0a 20        hit = 1;. 
2b70: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 6a                 j
2b80: 20 3d 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 20   = -1;.         
2b90: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 20       }.         
2ba0: 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20     }else{.      
2bb0: 20 20 20 20 20 20 20 20 69 66 28 20 70 52 65 2d          if( pRe-
2bc0: 3e 61 41 72 67 5b 78 2b 6a 5d 3c 3d 63 20 26 26  >aArg[x+j]<=c &&
2bd0: 20 70 52 65 2d 3e 61 41 72 67 5b 78 2b 6a 2b 31   pRe->aArg[x+j+1
2be0: 5d 3e 3d 63 20 29 7b 0a 20 20 20 20 20 20 20 20  ]>=c ){.        
2bf0: 20 20 20 20 20 20 20 20 68 69 74 20 3d 20 31 3b          hit = 1;
2c00: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
2c10: 20 6a 20 3d 20 2d 31 3b 0a 20 20 20 20 20 20 20   j = -1;.       
2c20: 20 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20         }else{.  
2c30: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 6a 2b                j+
2c40: 2b 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  +;.             
2c50: 20 7d 0a 20 20 20 20 20 20 20 20 20 20 20 20 7d   }.            }
2c60: 0a 20 20 20 20 20 20 20 20 20 20 7d 0a 20 20 20  .          }.   
2c70: 20 20 20 20 20 20 20 69 66 28 20 70 52 65 2d 3e         if( pRe->
2c80: 61 4f 70 5b 78 5d 3d 3d 52 45 5f 4f 50 5f 43 43  aOp[x]==RE_OP_CC
2c90: 5f 45 58 43 20 29 20 68 69 74 20 3d 20 21 68 69  _EXC ) hit = !hi
2ca0: 74 3b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28  t;.          if(
2cb0: 20 68 69 74 20 29 20 72 65 5f 61 64 64 5f 73 74   hit ) re_add_st
2cc0: 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 6e 29 3b  ate(pNext, x+n);
2cd0: 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b  .          break
2ce0: 3b 20 20 20 20 20 20 20 20 20 20 20 20 0a 20 20  ;            .  
2cf0: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 7d 0a        }.      }.
2d00: 20 20 20 20 7d 0a 20 20 7d 0a 20 20 66 6f 72 28      }.  }.  for(
2d10: 69 3d 30 3b 20 69 3c 70 4e 65 78 74 2d 3e 6e 53  i=0; i<pNext->nS
2d20: 74 61 74 65 3b 20 69 2b 2b 29 7b 0a 20 20 20 20  tate; i++){.    
2d30: 69 66 28 20 70 52 65 2d 3e 61 4f 70 5b 70 4e 65  if( pRe->aOp[pNe
2d40: 78 74 2d 3e 61 53 74 61 74 65 5b 69 5d 5d 3d 3d  xt->aState[i]]==
2d50: 52 45 5f 4f 50 5f 41 43 43 45 50 54 20 29 7b 20  RE_OP_ACCEPT ){ 
2d60: 72 63 20 3d 20 31 3b 20 62 72 65 61 6b 3b 20 7d  rc = 1; break; }
2d70: 0a 20 20 7d 0a 72 65 5f 6d 61 74 63 68 5f 65 6e  .  }.re_match_en
2d80: 64 3a 0a 20 20 73 71 6c 69 74 65 33 5f 66 72 65  d:.  sqlite3_fre
2d90: 65 28 70 54 6f 46 72 65 65 29 3b 0a 20 20 72 65  e(pToFree);.  re
2da0: 74 75 72 6e 20 72 63 3b 0a 7d 0a 0a 2f 2a 20 52  turn rc;.}../* R
2db0: 65 73 69 7a 65 20 74 68 65 20 6f 70 63 6f 64 65  esize the opcode
2dc0: 20 61 6e 64 20 61 72 67 75 6d 65 6e 74 20 61 72   and argument ar
2dd0: 72 61 79 73 20 66 6f 72 20 61 6e 20 52 45 20 75  rays for an RE u
2de0: 6e 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69 6f  nder constructio
2df0: 6e 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74  n..*/.static int
2e00: 20 72 65 5f 72 65 73 69 7a 65 28 52 65 43 6f 6d   re_resize(ReCom
2e10: 70 69 6c 65 64 20 2a 70 2c 20 69 6e 74 20 4e 29  piled *p, int N)
2e20: 7b 0a 20 20 63 68 61 72 20 2a 61 4f 70 3b 0a 20  {.  char *aOp;. 
2e30: 20 69 6e 74 20 2a 61 41 72 67 3b 0a 20 20 61 4f   int *aArg;.  aO
2e40: 70 20 3d 20 73 71 6c 69 74 65 33 5f 72 65 61 6c  p = sqlite3_real
2e50: 6c 6f 63 28 70 2d 3e 61 4f 70 2c 20 4e 2a 73 69  loc(p->aOp, N*si
2e60: 7a 65 6f 66 28 70 2d 3e 61 4f 70 5b 30 5d 29 29  zeof(p->aOp[0]))
2e70: 3b 0a 20 20 69 66 28 20 61 4f 70 3d 3d 30 20 29  ;.  if( aOp==0 )
2e80: 20 72 65 74 75 72 6e 20 31 3b 0a 20 20 70 2d 3e   return 1;.  p->
2e90: 61 4f 70 20 3d 20 61 4f 70 3b 0a 20 20 61 41 72  aOp = aOp;.  aAr
2ea0: 67 20 3d 20 73 71 6c 69 74 65 33 5f 72 65 61 6c  g = sqlite3_real
2eb0: 6c 6f 63 28 70 2d 3e 61 41 72 67 2c 20 4e 2a 73  loc(p->aArg, N*s
2ec0: 69 7a 65 6f 66 28 70 2d 3e 61 41 72 67 5b 30 5d  izeof(p->aArg[0]
2ed0: 29 29 3b 0a 20 20 69 66 28 20 61 41 72 67 3d 3d  ));.  if( aArg==
2ee0: 30 20 29 20 72 65 74 75 72 6e 20 31 3b 0a 20 20  0 ) return 1;.  
2ef0: 70 2d 3e 61 41 72 67 20 3d 20 61 41 72 67 3b 0a  p->aArg = aArg;.
2f00: 20 20 70 2d 3e 6e 41 6c 6c 6f 63 20 3d 20 4e 3b    p->nAlloc = N;
2f10: 0a 20 20 72 65 74 75 72 6e 20 30 3b 0a 7d 0a 0a  .  return 0;.}..
2f20: 2f 2a 20 49 6e 73 65 72 74 20 61 20 6e 65 77 20  /* Insert a new 
2f30: 6f 70 63 6f 64 65 20 61 6e 64 20 61 72 67 75 6d  opcode and argum
2f40: 65 6e 74 20 69 6e 74 6f 20 61 6e 20 52 45 20 75  ent into an RE u
2f50: 6e 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69 6f  nder constructio
2f60: 6e 2e 20 20 54 68 65 0a 2a 2a 20 69 6e 73 65 72  n.  The.** inser
2f70: 74 69 6f 6e 20 70 6f 69 6e 74 20 69 73 20 6a 75  tion point is ju
2f80: 73 74 20 70 72 69 6f 72 20 74 6f 20 65 78 69 73  st prior to exis
2f90: 74 69 6e 67 20 6f 70 63 6f 64 65 20 69 42 65 66  ting opcode iBef
2fa0: 6f 72 65 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 69  ore..*/.static i
2fb0: 6e 74 20 72 65 5f 69 6e 73 65 72 74 28 52 65 43  nt re_insert(ReC
2fc0: 6f 6d 70 69 6c 65 64 20 2a 70 2c 20 69 6e 74 20  ompiled *p, int 
2fd0: 69 42 65 66 6f 72 65 2c 20 69 6e 74 20 6f 70 2c  iBefore, int op,
2fe0: 20 69 6e 74 20 61 72 67 29 7b 0a 20 20 69 6e 74   int arg){.  int
2ff0: 20 69 3b 0a 20 20 69 66 28 20 70 2d 3e 6e 41 6c   i;.  if( p->nAl
3000: 6c 6f 63 3c 3d 70 2d 3e 6e 53 74 61 74 65 20 26  loc<=p->nState &
3010: 26 20 72 65 5f 72 65 73 69 7a 65 28 70 2c 20 70  & re_resize(p, p
3020: 2d 3e 6e 41 6c 6c 6f 63 2a 32 29 20 29 20 72 65  ->nAlloc*2) ) re
3030: 74 75 72 6e 20 30 3b 0a 20 20 66 6f 72 28 69 3d  turn 0;.  for(i=
3040: 70 2d 3e 6e 53 74 61 74 65 3b 20 69 3e 69 42 65  p->nState; i>iBe
3050: 66 6f 72 65 3b 20 69 2d 2d 29 7b 0a 20 20 20 20  fore; i--){.    
3060: 70 2d 3e 61 4f 70 5b 69 5d 20 3d 20 70 2d 3e 61  p->aOp[i] = p->a
3070: 4f 70 5b 69 2d 31 5d 3b 0a 20 20 20 20 70 2d 3e  Op[i-1];.    p->
3080: 61 41 72 67 5b 69 5d 20 3d 20 70 2d 3e 61 41 72  aArg[i] = p->aAr
3090: 67 5b 69 2d 31 5d 3b 0a 20 20 7d 0a 20 20 70 2d  g[i-1];.  }.  p-
30a0: 3e 6e 53 74 61 74 65 2b 2b 3b 0a 20 20 70 2d 3e  >nState++;.  p->
30b0: 61 4f 70 5b 69 42 65 66 6f 72 65 5d 20 3d 20 6f  aOp[iBefore] = o
30c0: 70 3b 0a 20 20 70 2d 3e 61 41 72 67 5b 69 42 65  p;.  p->aArg[iBe
30d0: 66 6f 72 65 5d 20 3d 20 61 72 67 3b 0a 20 20 72  fore] = arg;.  r
30e0: 65 74 75 72 6e 20 69 42 65 66 6f 72 65 3b 0a 7d  eturn iBefore;.}
30f0: 0a 0a 2f 2a 20 41 70 70 65 6e 64 20 61 20 6e 65  ../* Append a ne
3100: 77 20 6f 70 63 6f 64 65 20 61 6e 64 20 61 72 67  w opcode and arg
3110: 75 6d 65 6e 74 20 74 6f 20 74 68 65 20 65 6e 64  ument to the end
3120: 20 6f 66 20 74 68 65 20 52 45 20 75 6e 64 65 72   of the RE under
3130: 20 63 6f 6e 73 74 72 75 63 74 69 6f 6e 2e 0a 2a   construction..*
3140: 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f  /.static int re_
3150: 61 70 70 65 6e 64 28 52 65 43 6f 6d 70 69 6c 65  append(ReCompile
3160: 64 20 2a 70 2c 20 69 6e 74 20 6f 70 2c 20 69 6e  d *p, int op, in
3170: 74 20 61 72 67 29 7b 0a 20 20 72 65 74 75 72 6e  t arg){.  return
3180: 20 72 65 5f 69 6e 73 65 72 74 28 70 2c 20 70 2d   re_insert(p, p-
3190: 3e 6e 53 74 61 74 65 2c 20 6f 70 2c 20 61 72 67  >nState, op, arg
31a0: 29 3b 0a 7d 0a 0a 2f 2a 20 4d 61 6b 65 20 61 20  );.}../* Make a 
31b0: 63 6f 70 79 20 6f 66 20 4e 20 6f 70 63 6f 64 65  copy of N opcode
31c0: 73 20 73 74 61 72 74 69 6e 67 20 61 74 20 69 53  s starting at iS
31d0: 74 61 72 74 20 6f 6e 74 6f 20 74 68 65 20 65 6e  tart onto the en
31e0: 64 20 6f 66 20 74 68 65 20 52 45 0a 2a 2a 20 75  d of the RE.** u
31f0: 6e 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69 6f  nder constructio
3200: 6e 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 76 6f 69  n..*/.static voi
3210: 64 20 72 65 5f 63 6f 70 79 28 52 65 43 6f 6d 70  d re_copy(ReComp
3220: 69 6c 65 64 20 2a 70 2c 20 69 6e 74 20 69 53 74  iled *p, int iSt
3230: 61 72 74 2c 20 69 6e 74 20 4e 29 7b 0a 20 20 69  art, int N){.  i
3240: 66 28 20 70 2d 3e 6e 53 74 61 74 65 2b 4e 3e 3d  f( p->nState+N>=
3250: 70 2d 3e 6e 41 6c 6c 6f 63 20 26 26 20 72 65 5f  p->nAlloc && re_
3260: 72 65 73 69 7a 65 28 70 2c 20 70 2d 3e 6e 41 6c  resize(p, p->nAl
3270: 6c 6f 63 2a 32 2b 4e 29 20 29 20 72 65 74 75 72  loc*2+N) ) retur
3280: 6e 3b 0a 20 20 6d 65 6d 63 70 79 28 26 70 2d 3e  n;.  memcpy(&p->
3290: 61 4f 70 5b 70 2d 3e 6e 53 74 61 74 65 5d 2c 20  aOp[p->nState], 
32a0: 26 70 2d 3e 61 4f 70 5b 69 53 74 61 72 74 5d 2c  &p->aOp[iStart],
32b0: 20 4e 2a 73 69 7a 65 6f 66 28 70 2d 3e 61 4f 70   N*sizeof(p->aOp
32c0: 5b 30 5d 29 29 3b 0a 20 20 6d 65 6d 63 70 79 28  [0]));.  memcpy(
32d0: 26 70 2d 3e 61 41 72 67 5b 70 2d 3e 6e 53 74 61  &p->aArg[p->nSta
32e0: 74 65 5d 2c 20 26 70 2d 3e 61 41 72 67 5b 69 53  te], &p->aArg[iS
32f0: 74 61 72 74 5d 2c 20 4e 2a 73 69 7a 65 6f 66 28  tart], N*sizeof(
3300: 70 2d 3e 61 41 72 67 5b 30 5d 29 29 3b 0a 20 20  p->aArg[0]));.  
3310: 70 2d 3e 6e 53 74 61 74 65 20 2b 3d 20 4e 3b 0a  p->nState += N;.
3320: 7d 0a 0a 2f 2a 20 52 65 74 75 72 6e 20 74 72 75  }../* Return tru
3330: 65 20 69 66 20 63 20 69 73 20 61 20 68 65 78 61  e if c is a hexa
3340: 64 65 63 69 6d 61 6c 20 64 69 67 69 74 20 63 68  decimal digit ch
3350: 61 72 61 63 74 65 72 3a 20 20 5b 30 2d 39 61 2d  aracter:  [0-9a-
3360: 66 41 2d 46 5d 0a 2a 2a 20 49 66 20 63 20 69 73  fA-F].** If c is
3370: 20 61 20 68 65 78 20 64 69 67 69 74 2c 20 61 6c   a hex digit, al
3380: 73 6f 20 73 65 74 20 2a 70 56 20 3d 20 28 2a 70  so set *pV = (*p
3390: 56 29 2a 31 36 20 2b 20 76 61 6c 75 65 6f 66 28  V)*16 + valueof(
33a0: 63 29 2e 20 20 49 66 0a 2a 2a 20 63 20 69 73 20  c).  If.** c is 
33b0: 6e 6f 74 20 61 20 68 65 78 20 64 69 67 69 74 20  not a hex digit 
33c0: 2a 70 56 20 69 73 20 75 6e 63 68 61 6e 67 65 64  *pV is unchanged
33d0: 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74 20  ..*/.static int 
33e0: 72 65 5f 68 65 78 28 69 6e 74 20 63 2c 20 69 6e  re_hex(int c, in
33f0: 74 20 2a 70 56 29 7b 0a 20 20 69 66 28 20 63 3e  t *pV){.  if( c>
3400: 3d 27 30 27 20 26 26 20 63 3c 3d 27 39 27 20 29  ='0' && c<='9' )
3410: 7b 0a 20 20 20 20 63 20 2d 3d 20 27 30 27 3b 0a  {.    c -= '0';.
3420: 20 20 7d 65 6c 73 65 20 69 66 28 20 63 3e 3d 27    }else if( c>='
3430: 61 27 20 26 26 20 63 3c 3d 27 66 27 20 29 7b 0a  a' && c<='f' ){.
3440: 20 20 20 20 63 20 2d 3d 20 27 61 27 20 2d 20 31      c -= 'a' - 1
3450: 30 3b 0a 20 20 7d 65 6c 73 65 20 69 66 28 20 63  0;.  }else if( c
3460: 3e 3d 27 41 27 20 26 26 20 63 3c 3d 27 46 27 20  >='A' && c<='F' 
3470: 29 7b 0a 20 20 20 20 63 20 2d 3d 20 27 41 27 20  ){.    c -= 'A' 
3480: 2d 20 31 30 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20  - 10;.  }else{. 
3490: 20 20 20 72 65 74 75 72 6e 20 30 3b 0a 20 20 7d     return 0;.  }
34a0: 0a 20 20 2a 70 56 20 3d 20 28 2a 70 56 29 2a 31  .  *pV = (*pV)*1
34b0: 36 20 2b 20 28 63 20 26 20 30 78 66 66 29 3b 0a  6 + (c & 0xff);.
34c0: 20 20 72 65 74 75 72 6e 20 31 3b 0a 7d 0a 0a 2f    return 1;.}../
34d0: 2a 20 41 20 62 61 63 6b 73 6c 61 73 68 20 63 68  * A backslash ch
34e0: 61 72 61 63 74 65 72 20 68 61 73 20 62 65 65 6e  aracter has been
34f0: 20 73 65 65 6e 2c 20 72 65 61 64 20 74 68 65 20   seen, read the 
3500: 6e 65 78 74 20 63 68 61 72 61 63 74 65 72 20 61  next character a
3510: 6e 64 0a 2a 2a 20 72 65 74 75 72 6e 20 69 74 73  nd.** return its
3520: 20 69 6e 74 65 72 70 72 65 74 61 74 69 6f 6e 2e   interpretation.
3530: 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e 73 69 67  .*/.static unsig
3540: 6e 65 64 20 72 65 5f 65 73 63 5f 63 68 61 72 28  ned re_esc_char(
3550: 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 29 7b 0a  ReCompiled *p){.
3560: 20 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 63    static const c
3570: 68 61 72 20 7a 45 73 63 5b 5d 20 3d 20 22 61 66  har zEsc[] = "af
3580: 6e 72 74 76 5c 5c 28 29 2a 2e 2b 3f 5b 24 5e 7b  nrtv\\()*.+?[$^{
3590: 7c 7d 5d 22 3b 0a 20 20 73 74 61 74 69 63 20 63  |}]";.  static c
35a0: 6f 6e 73 74 20 63 68 61 72 20 7a 54 72 61 6e 73  onst char zTrans
35b0: 5b 5d 20 3d 20 22 5c 61 5c 66 5c 6e 5c 72 5c 74  [] = "\a\f\n\r\t
35c0: 5c 76 22 3b 0a 20 20 69 6e 74 20 69 2c 20 76 20  \v";.  int i, v 
35d0: 3d 20 30 3b 0a 20 20 63 68 61 72 20 63 3b 0a 20  = 0;.  char c;. 
35e0: 20 69 66 28 20 70 2d 3e 73 49 6e 2e 69 3e 3d 70   if( p->sIn.i>=p
35f0: 2d 3e 73 49 6e 2e 6d 78 20 29 20 72 65 74 75 72  ->sIn.mx ) retur
3600: 6e 20 30 3b 0a 20 20 63 20 3d 20 70 2d 3e 73 49  n 0;.  c = p->sI
3610: 6e 2e 7a 5b 70 2d 3e 73 49 6e 2e 69 5d 3b 0a 20  n.z[p->sIn.i];. 
3620: 20 69 66 28 20 63 3d 3d 27 75 27 20 26 26 20 70   if( c=='u' && p
3630: 2d 3e 73 49 6e 2e 69 2b 34 3c 70 2d 3e 73 49 6e  ->sIn.i+4<p->sIn
3640: 2e 6d 78 20 29 7b 0a 20 20 20 20 63 6f 6e 73 74  .mx ){.    const
3650: 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a   unsigned char *
3660: 7a 49 6e 20 3d 20 70 2d 3e 73 49 6e 2e 7a 20 2b  zIn = p->sIn.z +
3670: 20 70 2d 3e 73 49 6e 2e 69 3b 0a 20 20 20 20 69   p->sIn.i;.    i
3680: 66 28 20 72 65 5f 68 65 78 28 7a 49 6e 5b 31 5d  f( re_hex(zIn[1]
3690: 2c 26 76 29 0a 20 20 20 20 20 26 26 20 72 65 5f  ,&v).     && re_
36a0: 68 65 78 28 7a 49 6e 5b 32 5d 2c 26 76 29 0a 20  hex(zIn[2],&v). 
36b0: 20 20 20 20 26 26 20 72 65 5f 68 65 78 28 7a 49      && re_hex(zI
36c0: 6e 5b 33 5d 2c 26 76 29 0a 20 20 20 20 20 26 26  n[3],&v).     &&
36d0: 20 72 65 5f 68 65 78 28 7a 49 6e 5b 34 5d 2c 26   re_hex(zIn[4],&
36e0: 76 29 0a 20 20 20 20 29 7b 0a 20 20 20 20 20 20  v).    ){.      
36f0: 70 2d 3e 73 49 6e 2e 69 20 2b 3d 20 35 3b 0a 20  p->sIn.i += 5;. 
3700: 20 20 20 20 20 72 65 74 75 72 6e 20 76 3b 0a 20       return v;. 
3710: 20 20 20 7d 0a 20 20 7d 0a 20 20 69 66 28 20 63     }.  }.  if( c
3720: 3d 3d 27 78 27 20 26 26 20 70 2d 3e 73 49 6e 2e  =='x' && p->sIn.
3730: 69 2b 32 3c 70 2d 3e 73 49 6e 2e 6d 78 20 29 7b  i+2<p->sIn.mx ){
3740: 0a 20 20 20 20 63 6f 6e 73 74 20 75 6e 73 69 67  .    const unsig
3750: 6e 65 64 20 63 68 61 72 20 2a 7a 49 6e 20 3d 20  ned char *zIn = 
3760: 70 2d 3e 73 49 6e 2e 7a 20 2b 20 70 2d 3e 73 49  p->sIn.z + p->sI
3770: 6e 2e 69 3b 0a 20 20 20 20 69 66 28 20 72 65 5f  n.i;.    if( re_
3780: 68 65 78 28 7a 49 6e 5b 31 5d 2c 26 76 29 0a 20  hex(zIn[1],&v). 
3790: 20 20 20 20 26 26 20 72 65 5f 68 65 78 28 7a 49      && re_hex(zI
37a0: 6e 5b 32 5d 2c 26 76 29 0a 20 20 20 20 29 7b 0a  n[2],&v).    ){.
37b0: 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 20 2b        p->sIn.i +
37c0: 3d 20 33 3b 0a 20 20 20 20 20 20 72 65 74 75 72  = 3;.      retur
37d0: 6e 20 76 3b 0a 20 20 20 20 7d 0a 20 20 7d 0a 20  n v;.    }.  }. 
37e0: 20 66 6f 72 28 69 3d 30 3b 20 7a 45 73 63 5b 69   for(i=0; zEsc[i
37f0: 5d 20 26 26 20 7a 45 73 63 5b 69 5d 21 3d 63 3b  ] && zEsc[i]!=c;
3800: 20 69 2b 2b 29 7b 7d 0a 20 20 69 66 28 20 7a 45   i++){}.  if( zE
3810: 73 63 5b 69 5d 20 29 7b 0a 20 20 20 20 69 66 28  sc[i] ){.    if(
3820: 20 69 3c 36 20 29 20 63 20 3d 20 7a 54 72 61 6e   i<6 ) c = zTran
3830: 73 5b 69 5d 3b 0a 20 20 20 20 70 2d 3e 73 49 6e  s[i];.    p->sIn
3840: 2e 69 2b 2b 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20  .i++;.  }else{. 
3850: 20 20 20 70 2d 3e 7a 45 72 72 20 3d 20 22 75 6e     p->zErr = "un
3860: 6b 6e 6f 77 6e 20 5c 5c 20 65 73 63 61 70 65 22  known \\ escape"
3870: 3b 0a 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 63  ;.  }.  return c
3880: 3b 0a 7d 0a 0a 2f 2a 20 46 6f 72 77 61 72 64 20  ;.}../* Forward 
3890: 64 65 63 6c 61 72 61 74 69 6f 6e 20 2a 2f 0a 73  declaration */.s
38a0: 74 61 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72  tatic const char
38b0: 20 2a 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f   *re_subcompile_
38c0: 73 74 72 69 6e 67 28 52 65 43 6f 6d 70 69 6c 65  string(ReCompile
38d0: 64 2a 29 3b 0a 0a 2f 2a 20 50 65 65 6b 20 61 74  d*);../* Peek at
38e0: 20 74 68 65 20 6e 65 78 74 20 62 79 74 65 20 6f   the next byte o
38f0: 66 20 69 6e 70 75 74 20 2a 2f 0a 73 74 61 74 69  f input */.stati
3900: 63 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20  c unsigned char 
3910: 72 65 50 65 65 6b 28 52 65 43 6f 6d 70 69 6c 65  rePeek(ReCompile
3920: 64 20 2a 70 29 7b 0a 20 20 72 65 74 75 72 6e 20  d *p){.  return 
3930: 70 2d 3e 73 49 6e 2e 69 3c 70 2d 3e 73 49 6e 2e  p->sIn.i<p->sIn.
3940: 6d 78 20 3f 20 70 2d 3e 73 49 6e 2e 7a 5b 70 2d  mx ? p->sIn.z[p-
3950: 3e 73 49 6e 2e 69 5d 20 3a 20 30 3b 0a 7d 0a 0a  >sIn.i] : 0;.}..
3960: 2f 2a 20 43 6f 6d 70 69 6c 65 20 52 45 20 74 65  /* Compile RE te
3970: 78 74 20 69 6e 74 6f 20 61 20 73 65 71 75 65 6e  xt into a sequen
3980: 63 65 20 6f 66 20 6f 70 63 6f 64 65 73 2e 20 20  ce of opcodes.  
3990: 43 6f 6e 74 69 6e 75 65 20 75 70 20 74 6f 20 74  Continue up to t
39a0: 68 65 0a 2a 2a 20 66 69 72 73 74 20 75 6e 6d 61  he.** first unma
39b0: 74 63 68 65 64 20 22 29 22 20 63 68 61 72 61 63  tched ")" charac
39c0: 74 65 72 2c 20 74 68 65 6e 20 72 65 74 75 72 6e  ter, then return
39d0: 2e 20 20 49 66 20 61 6e 20 65 72 72 6f 72 20 69  .  If an error i
39e0: 73 20 66 6f 75 6e 64 2c 0a 2a 2a 20 72 65 74 75  s found,.** retu
39f0: 72 6e 20 61 20 70 6f 69 6e 74 65 72 20 74 6f 20  rn a pointer to 
3a00: 74 68 65 20 65 72 72 6f 72 20 6d 65 73 73 61 67  the error messag
3a10: 65 20 73 74 72 69 6e 67 2e 0a 2a 2f 0a 73 74 61  e string..*/.sta
3a20: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a  tic const char *
3a30: 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 72 65  re_subcompile_re
3a40: 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 29 7b  (ReCompiled *p){
3a50: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a  .  const char *z
3a60: 45 72 72 3b 0a 20 20 69 6e 74 20 69 53 74 61 72  Err;.  int iStar
3a70: 74 2c 20 69 45 6e 64 2c 20 69 47 6f 74 6f 3b 0a  t, iEnd, iGoto;.
3a80: 20 20 69 53 74 61 72 74 20 3d 20 70 2d 3e 6e 53    iStart = p->nS
3a90: 74 61 74 65 3b 0a 20 20 7a 45 72 72 20 3d 20 72  tate;.  zErr = r
3aa0: 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 73 74 72  e_subcompile_str
3ab0: 69 6e 67 28 70 29 3b 0a 20 20 69 66 28 20 7a 45  ing(p);.  if( zE
3ac0: 72 72 20 29 20 72 65 74 75 72 6e 20 7a 45 72 72  rr ) return zErr
3ad0: 3b 0a 20 20 77 68 69 6c 65 28 20 72 65 50 65 65  ;.  while( rePee
3ae0: 6b 28 70 29 3d 3d 27 7c 27 20 29 7b 0a 20 20 20  k(p)=='|' ){.   
3af0: 20 69 45 6e 64 20 3d 20 70 2d 3e 6e 53 74 61 74   iEnd = p->nStat
3b00: 65 3b 0a 20 20 20 20 72 65 5f 69 6e 73 65 72 74  e;.    re_insert
3b10: 28 70 2c 20 69 53 74 61 72 74 2c 20 52 45 5f 4f  (p, iStart, RE_O
3b20: 50 5f 46 4f 52 4b 2c 20 69 45 6e 64 20 2b 20 32  P_FORK, iEnd + 2
3b30: 20 2d 20 69 53 74 61 72 74 29 3b 0a 20 20 20 20   - iStart);.    
3b40: 69 47 6f 74 6f 20 3d 20 72 65 5f 61 70 70 65 6e  iGoto = re_appen
3b50: 64 28 70 2c 20 52 45 5f 4f 50 5f 47 4f 54 4f 2c  d(p, RE_OP_GOTO,
3b60: 20 30 29 3b 0a 20 20 20 20 70 2d 3e 73 49 6e 2e   0);.    p->sIn.
3b70: 69 2b 2b 3b 0a 20 20 20 20 7a 45 72 72 20 3d 20  i++;.    zErr = 
3b80: 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 73 74  re_subcompile_st
3b90: 72 69 6e 67 28 70 29 3b 0a 20 20 20 20 69 66 28  ring(p);.    if(
3ba0: 20 7a 45 72 72 20 29 20 72 65 74 75 72 6e 20 7a   zErr ) return z
3bb0: 45 72 72 3b 0a 20 20 20 20 70 2d 3e 61 41 72 67  Err;.    p->aArg
3bc0: 5b 69 47 6f 74 6f 5d 20 3d 20 70 2d 3e 6e 53 74  [iGoto] = p->nSt
3bd0: 61 74 65 20 2d 20 69 47 6f 74 6f 3b 0a 20 20 7d  ate - iGoto;.  }
3be0: 0a 20 20 72 65 74 75 72 6e 20 30 3b 0a 7d 0a 0a  .  return 0;.}..
3bf0: 2f 2a 20 43 6f 6d 70 69 6c 65 20 61 6e 20 65 6c  /* Compile an el
3c00: 65 6d 65 6e 74 20 6f 66 20 72 65 67 75 6c 61 72  ement of regular
3c10: 20 65 78 70 72 65 73 73 69 6f 6e 20 74 65 78 74   expression text
3c20: 20 28 61 6e 79 74 68 69 6e 67 20 74 68 61 74 20   (anything that 
3c30: 63 61 6e 20 62 65 0a 2a 2a 20 61 6e 20 6f 70 65  can be.** an ope
3c40: 72 61 6e 64 20 74 6f 20 74 68 65 20 22 7c 22 20  rand to the "|" 
3c50: 6f 70 65 72 61 74 6f 72 29 2e 20 20 52 65 74 75  operator).  Retu
3c60: 72 6e 20 4e 55 4c 4c 20 6f 6e 20 73 75 63 63 65  rn NULL on succe
3c70: 73 73 20 6f 72 20 61 20 70 6f 69 6e 74 65 72 0a  ss or a pointer.
3c80: 2a 2a 20 74 6f 20 74 68 65 20 65 72 72 6f 72 20  ** to the error 
3c90: 6d 65 73 73 61 67 65 20 69 66 20 74 68 65 72 65  message if there
3ca0: 20 69 73 20 61 20 70 72 6f 62 6c 65 6d 2e 0a 2a   is a problem..*
3cb0: 2f 0a 73 74 61 74 69 63 20 63 6f 6e 73 74 20 63  /.static const c
3cc0: 68 61 72 20 2a 72 65 5f 73 75 62 63 6f 6d 70 69  har *re_subcompi
3cd0: 6c 65 5f 73 74 72 69 6e 67 28 52 65 43 6f 6d 70  le_string(ReComp
3ce0: 69 6c 65 64 20 2a 70 29 7b 0a 20 20 69 6e 74 20  iled *p){.  int 
3cf0: 69 50 72 65 76 20 3d 20 2d 31 3b 0a 20 20 69 6e  iPrev = -1;.  in
3d00: 74 20 69 53 74 61 72 74 3b 0a 20 20 75 6e 73 69  t iStart;.  unsi
3d10: 67 6e 65 64 20 63 3b 0a 20 20 63 6f 6e 73 74 20  gned c;.  const 
3d20: 63 68 61 72 20 2a 7a 45 72 72 3b 0a 20 20 77 68  char *zErr;.  wh
3d30: 69 6c 65 28 20 28 63 20 3d 20 70 2d 3e 78 4e 65  ile( (c = p->xNe
3d40: 78 74 43 68 61 72 28 26 70 2d 3e 73 49 6e 29 29  xtChar(&p->sIn))
3d50: 21 3d 30 20 29 7b 0a 20 20 20 20 69 53 74 61 72  !=0 ){.    iStar
3d60: 74 20 3d 20 70 2d 3e 6e 53 74 61 74 65 3b 0a 20  t = p->nState;. 
3d70: 20 20 20 73 77 69 74 63 68 28 20 63 20 29 7b 0a     switch( c ){.
3d80: 20 20 20 20 20 20 63 61 73 65 20 27 7c 27 3a 0a        case '|':.
3d90: 20 20 20 20 20 20 63 61 73 65 20 27 24 27 3a 20        case '$': 
3da0: 0a 20 20 20 20 20 20 63 61 73 65 20 27 29 27 3a  .      case ')':
3db0: 20 7b 0a 20 20 20 20 20 20 20 20 70 2d 3e 73 49   {.        p->sI
3dc0: 6e 2e 69 2d 2d 3b 0a 20 20 20 20 20 20 20 20 72  n.i--;.        r
3dd0: 65 74 75 72 6e 20 30 3b 0a 20 20 20 20 20 20 7d  eturn 0;.      }
3de0: 0a 20 20 20 20 20 20 63 61 73 65 20 27 28 27 3a  .      case '(':
3df0: 20 7b 0a 20 20 20 20 20 20 20 20 7a 45 72 72 20   {.        zErr 
3e00: 3d 20 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f  = re_subcompile_
3e10: 72 65 28 70 29 3b 0a 20 20 20 20 20 20 20 20 69  re(p);.        i
3e20: 66 28 20 7a 45 72 72 20 29 20 72 65 74 75 72 6e  f( zErr ) return
3e30: 20 7a 45 72 72 3b 0a 20 20 20 20 20 20 20 20 69   zErr;.        i
3e40: 66 28 20 72 65 50 65 65 6b 28 70 29 21 3d 27 29  f( rePeek(p)!=')
3e50: 27 20 29 20 72 65 74 75 72 6e 20 22 75 6e 6d 61  ' ) return "unma
3e60: 74 63 68 65 64 20 27 28 27 22 3b 0a 20 20 20 20  tched '('";.    
3e70: 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a      p->sIn.i++;.
3e80: 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20          break;. 
3e90: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61 73       }.      cas
3ea0: 65 20 27 2e 27 3a 20 7b 0a 20 20 20 20 20 20 20  e '.': {.       
3eb0: 20 69 66 28 20 72 65 50 65 65 6b 28 70 29 3d 3d   if( rePeek(p)==
3ec0: 27 2a 27 20 29 7b 0a 20 20 20 20 20 20 20 20 20  '*' ){.         
3ed0: 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45   re_append(p, RE
3ee0: 5f 4f 50 5f 41 4e 59 53 54 41 52 2c 20 30 29 3b  _OP_ANYSTAR, 0);
3ef0: 0a 20 20 20 20 20 20 20 20 20 20 70 2d 3e 73 49  .          p->sI
3f00: 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20 20 20 20 7d  n.i++;.        }
3f10: 65 6c 73 65 7b 20 0a 20 20 20 20 20 20 20 20 20  else{ .         
3f20: 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45   re_append(p, RE
3f30: 5f 4f 50 5f 41 4e 59 2c 20 30 29 3b 0a 20 20 20  _OP_ANY, 0);.   
3f40: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62       }.        b
3f50: 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20  reak;.      }.  
3f60: 20 20 20 20 63 61 73 65 20 27 2a 27 3a 20 7b 0a      case '*': {.
3f70: 20 20 20 20 20 20 20 20 69 66 28 20 69 50 72 65          if( iPre
3f80: 76 3c 30 20 29 20 72 65 74 75 72 6e 20 22 27 2a  v<0 ) return "'*
3f90: 27 20 77 69 74 68 6f 75 74 20 6f 70 65 72 61 6e  ' without operan
3fa0: 64 22 3b 0a 20 20 20 20 20 20 20 20 72 65 5f 69  d";.        re_i
3fb0: 6e 73 65 72 74 28 70 2c 20 69 50 72 65 76 2c 20  nsert(p, iPrev, 
3fc0: 52 45 5f 4f 50 5f 47 4f 54 4f 2c 20 70 2d 3e 6e  RE_OP_GOTO, p->n
3fd0: 53 74 61 74 65 20 2d 20 69 50 72 65 76 20 2b 20  State - iPrev + 
3fe0: 31 29 3b 0a 20 20 20 20 20 20 20 20 72 65 5f 61  1);.        re_a
3ff0: 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 46  ppend(p, RE_OP_F
4000: 4f 52 4b 2c 20 69 50 72 65 76 20 2d 20 70 2d 3e  ORK, iPrev - p->
4010: 6e 53 74 61 74 65 20 2b 20 31 29 3b 0a 20 20 20  nState + 1);.   
4020: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
4030: 20 20 7d 0a 20 20 20 20 20 20 63 61 73 65 20 27    }.      case '
4040: 2b 27 3a 20 7b 0a 20 20 20 20 20 20 20 20 69 66  +': {.        if
4050: 28 20 69 50 72 65 76 3c 30 20 29 20 72 65 74 75  ( iPrev<0 ) retu
4060: 72 6e 20 22 27 2b 27 20 77 69 74 68 6f 75 74 20  rn "'+' without 
4070: 6f 70 65 72 61 6e 64 22 3b 0a 20 20 20 20 20 20  operand";.      
4080: 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52    re_append(p, R
4090: 45 5f 4f 50 5f 46 4f 52 4b 2c 20 69 50 72 65 76  E_OP_FORK, iPrev
40a0: 20 2d 20 70 2d 3e 6e 53 74 61 74 65 29 3b 0a 20   - p->nState);. 
40b0: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20         break;.  
40c0: 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61 73 65      }.      case
40d0: 20 27 3f 27 3a 20 7b 0a 20 20 20 20 20 20 20 20   '?': {.        
40e0: 69 66 28 20 69 50 72 65 76 3c 30 20 29 20 72 65  if( iPrev<0 ) re
40f0: 74 75 72 6e 20 22 27 3f 27 20 77 69 74 68 6f 75  turn "'?' withou
4100: 74 20 6f 70 65 72 61 6e 64 22 3b 0a 20 20 20 20  t operand";.    
4110: 20 20 20 20 72 65 5f 69 6e 73 65 72 74 28 70 2c      re_insert(p,
4120: 20 69 50 72 65 76 2c 20 52 45 5f 4f 50 5f 46 4f   iPrev, RE_OP_FO
4130: 52 4b 2c 20 70 2d 3e 6e 53 74 61 74 65 20 2d 20  RK, p->nState - 
4140: 69 50 72 65 76 2b 31 29 3b 0a 20 20 20 20 20 20  iPrev+1);.      
4150: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d    break;.      }
4160: 0a 20 20 20 20 20 20 63 61 73 65 20 27 7b 27 3a  .      case '{':
4170: 20 7b 0a 20 20 20 20 20 20 20 20 69 6e 74 20 6d   {.        int m
4180: 20 3d 20 30 2c 20 6e 20 3d 20 30 3b 0a 20 20 20   = 0, n = 0;.   
4190: 20 20 20 20 20 69 6e 74 20 73 7a 2c 20 6a 3b 0a       int sz, j;.
41a0: 20 20 20 20 20 20 20 20 69 66 28 20 69 50 72 65          if( iPre
41b0: 76 3c 30 20 29 20 72 65 74 75 72 6e 20 22 27 7b  v<0 ) return "'{
41c0: 6d 2c 6e 7d 27 20 77 69 74 68 6f 75 74 20 6f 70  m,n}' without op
41d0: 65 72 61 6e 64 22 3b 0a 20 20 20 20 20 20 20 20  erand";.        
41e0: 77 68 69 6c 65 28 20 28 63 3d 72 65 50 65 65 6b  while( (c=rePeek
41f0: 28 70 29 29 3e 3d 27 30 27 20 26 26 20 63 3c 3d  (p))>='0' && c<=
4200: 27 39 27 20 29 7b 20 6d 20 3d 20 6d 2a 31 30 20  '9' ){ m = m*10 
4210: 2b 20 63 20 2d 20 27 30 27 3b 20 70 2d 3e 73 49  + c - '0'; p->sI
4220: 6e 2e 69 2b 2b 3b 20 7d 0a 20 20 20 20 20 20 20  n.i++; }.       
4230: 20 6e 20 3d 20 6d 3b 0a 20 20 20 20 20 20 20 20   n = m;.        
4240: 69 66 28 20 63 3d 3d 27 2c 27 20 29 7b 0a 20 20  if( c==',' ){.  
4250: 20 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69          p->sIn.i
4260: 2b 2b 3b 0a 20 20 20 20 20 20 20 20 20 20 6e 20  ++;.          n 
4270: 3d 20 30 3b 0a 20 20 20 20 20 20 20 20 20 20 77  = 0;.          w
4280: 68 69 6c 65 28 20 28 63 3d 72 65 50 65 65 6b 28  hile( (c=rePeek(
4290: 70 29 29 3e 3d 27 30 27 20 26 26 20 63 3c 3d 27  p))>='0' && c<='
42a0: 39 27 20 29 7b 20 6e 20 3d 20 6e 2a 31 30 20 2b  9' ){ n = n*10 +
42b0: 20 63 2d 27 30 27 3b 20 70 2d 3e 73 49 6e 2e 69   c-'0'; p->sIn.i
42c0: 2b 2b 3b 20 7d 0a 20 20 20 20 20 20 20 20 7d 0a  ++; }.        }.
42d0: 20 20 20 20 20 20 20 20 69 66 28 20 63 21 3d 27          if( c!='
42e0: 7d 27 20 29 20 72 65 74 75 72 6e 20 22 75 6e 6d  }' ) return "unm
42f0: 61 74 63 68 65 64 20 27 7b 27 22 3b 0a 20 20 20  atched '{'";.   
4300: 20 20 20 20 20 69 66 28 20 6e 3e 30 20 26 26 20       if( n>0 && 
4310: 6e 3c 6d 20 29 20 72 65 74 75 72 6e 20 22 6e 20  n<m ) return "n 
4320: 6c 65 73 73 20 74 68 61 6e 20 6d 20 69 6e 20 27  less than m in '
4330: 7b 6d 2c 6e 7d 27 22 3b 0a 20 20 20 20 20 20 20  {m,n}'";.       
4340: 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20   p->sIn.i++;.   
4350: 20 20 20 20 20 73 7a 20 3d 20 70 2d 3e 6e 53 74       sz = p->nSt
4360: 61 74 65 20 2d 20 69 50 72 65 76 3b 0a 20 20 20  ate - iPrev;.   
4370: 20 20 20 20 20 69 66 28 20 6d 3d 3d 30 20 29 7b       if( m==0 ){
4380: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 6e  .          if( n
4390: 3d 3d 30 20 29 20 72 65 74 75 72 6e 20 22 62 6f  ==0 ) return "bo
43a0: 74 68 20 6d 20 61 6e 64 20 6e 20 61 72 65 20 7a  th m and n are z
43b0: 65 72 6f 20 69 6e 20 27 7b 6d 2c 6e 7d 27 22 3b  ero in '{m,n}'";
43c0: 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 69 6e  .          re_in
43d0: 73 65 72 74 28 70 2c 20 69 50 72 65 76 2c 20 52  sert(p, iPrev, R
43e0: 45 5f 4f 50 5f 46 4f 52 4b 2c 20 73 7a 2b 31 29  E_OP_FORK, sz+1)
43f0: 3b 0a 20 20 20 20 20 20 20 20 20 20 6e 2d 2d 3b  ;.          n--;
4400: 0a 20 20 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a  .        }else{.
4410: 20 20 20 20 20 20 20 20 20 20 66 6f 72 28 6a 3d            for(j=
4420: 31 3b 20 6a 3c 6d 3b 20 6a 2b 2b 29 20 72 65 5f  1; j<m; j++) re_
4430: 63 6f 70 79 28 70 2c 20 69 50 72 65 76 2c 20 73  copy(p, iPrev, s
4440: 7a 29 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20  z);.        }.  
4450: 20 20 20 20 20 20 66 6f 72 28 6a 3d 6d 3b 20 6a        for(j=m; j
4460: 3c 6e 3b 20 6a 2b 2b 29 7b 0a 20 20 20 20 20 20  <n; j++){.      
4470: 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c      re_append(p,
4480: 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20 73 7a 2b   RE_OP_FORK, sz+
4490: 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20 72 65  1);.          re
44a0: 5f 63 6f 70 79 28 70 2c 20 69 50 72 65 76 2c 20  _copy(p, iPrev, 
44b0: 73 7a 29 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20  sz);.        }. 
44c0: 20 20 20 20 20 20 20 69 66 28 20 6e 3d 3d 30 20         if( n==0 
44d0: 26 26 20 6d 3e 30 20 29 7b 0a 20 20 20 20 20 20  && m>0 ){.      
44e0: 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c      re_append(p,
44f0: 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20 2d 73 7a   RE_OP_FORK, -sz
4500: 29 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20  );.        }.   
4510: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
4520: 20 20 7d 0a 20 20 20 20 20 20 63 61 73 65 20 27    }.      case '
4530: 5b 27 3a 20 7b 0a 20 20 20 20 20 20 20 20 69 6e  [': {.        in
4540: 74 20 69 46 69 72 73 74 20 3d 20 70 2d 3e 6e 53  t iFirst = p->nS
4550: 74 61 74 65 3b 0a 20 20 20 20 20 20 20 20 69 66  tate;.        if
4560: 28 20 72 65 50 65 65 6b 28 70 29 3d 3d 27 5e 27  ( rePeek(p)=='^'
4570: 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65   ){.          re
4580: 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50  _append(p, RE_OP
4590: 5f 43 43 5f 45 58 43 2c 20 30 29 3b 0a 20 20 20  _CC_EXC, 0);.   
45a0: 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b         p->sIn.i+
45b0: 2b 3b 0a 20 20 20 20 20 20 20 20 7d 65 6c 73 65  +;.        }else
45c0: 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61  {.          re_a
45d0: 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 43  ppend(p, RE_OP_C
45e0: 43 5f 49 4e 43 2c 20 30 29 3b 0a 20 20 20 20 20  C_INC, 0);.     
45f0: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 77 68 69     }.        whi
4600: 6c 65 28 20 28 63 20 3d 20 70 2d 3e 78 4e 65 78  le( (c = p->xNex
4610: 74 43 68 61 72 28 26 70 2d 3e 73 49 6e 29 29 21  tChar(&p->sIn))!
4620: 3d 30 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20  =0 ){.          
4630: 69 66 28 20 63 3d 3d 27 5b 27 20 26 26 20 72 65  if( c=='[' && re
4640: 50 65 65 6b 28 70 29 3d 3d 27 3a 27 20 29 7b 0a  Peek(p)==':' ){.
4650: 20 20 20 20 20 20 20 20 20 20 20 20 72 65 74 75              retu
4660: 72 6e 20 22 50 4f 53 49 58 20 63 68 61 72 61 63  rn "POSIX charac
4670: 74 65 72 20 63 6c 61 73 73 65 73 20 6e 6f 74 20  ter classes not 
4680: 73 75 70 70 6f 72 74 65 64 22 3b 0a 20 20 20 20  supported";.    
4690: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
46a0: 20 20 69 66 28 20 63 3d 3d 27 5c 5c 27 20 29 20    if( c=='\\' ) 
46b0: 63 20 3d 20 72 65 5f 65 73 63 5f 63 68 61 72 28  c = re_esc_char(
46c0: 70 29 3b 0a 20 20 20 20 20 20 20 20 20 20 69 66  p);.          if
46d0: 28 20 72 65 50 65 65 6b 28 70 29 3d 3d 27 2d 27  ( rePeek(p)=='-'
46e0: 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 20 20   ){.            
46f0: 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f  re_append(p, RE_
4700: 4f 50 5f 43 43 5f 52 41 4e 47 45 2c 20 63 29 3b  OP_CC_RANGE, c);
4710: 0a 20 20 20 20 20 20 20 20 20 20 20 20 70 2d 3e  .            p->
4720: 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20 20 20  sIn.i++;.       
4730: 20 20 20 20 20 63 20 3d 20 70 2d 3e 78 4e 65 78       c = p->xNex
4740: 74 43 68 61 72 28 26 70 2d 3e 73 49 6e 29 3b 0a  tChar(&p->sIn);.
4750: 20 20 20 20 20 20 20 20 20 20 20 20 69 66 28 20              if( 
4760: 63 3d 3d 27 5c 5c 27 20 29 20 63 20 3d 20 72 65  c=='\\' ) c = re
4770: 5f 65 73 63 5f 63 68 61 72 28 70 29 3b 0a 20 20  _esc_char(p);.  
4780: 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 70 70            re_app
4790: 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f  end(p, RE_OP_CC_
47a0: 52 41 4e 47 45 2c 20 63 29 3b 0a 20 20 20 20 20  RANGE, c);.     
47b0: 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20       }else{.    
47c0: 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e          re_appen
47d0: 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f 56 41  d(p, RE_OP_CC_VA
47e0: 4c 55 45 2c 20 63 29 3b 0a 20 20 20 20 20 20 20  LUE, c);.       
47f0: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 20 20 69     }.          i
4800: 66 28 20 72 65 50 65 65 6b 28 70 29 3d 3d 27 5d  f( rePeek(p)==']
4810: 27 20 29 7b 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b  ' ){ p->sIn.i++;
4820: 20 62 72 65 61 6b 3b 20 7d 0a 20 20 20 20 20 20   break; }.      
4830: 20 20 7d 0a 20 20 20 20 20 20 20 20 69 66 28 20    }.        if( 
4840: 63 3d 3d 30 20 29 20 72 65 74 75 72 6e 20 22 75  c==0 ) return "u
4850: 6e 63 6c 6f 73 65 64 20 27 5b 27 22 3b 0a 20 20  nclosed '['";.  
4860: 20 20 20 20 20 20 70 2d 3e 61 41 72 67 5b 69 46        p->aArg[iF
4870: 69 72 73 74 5d 20 3d 20 70 2d 3e 6e 53 74 61 74  irst] = p->nStat
4880: 65 20 2d 20 69 46 69 72 73 74 3b 0a 20 20 20 20  e - iFirst;.    
4890: 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20      break;.     
48a0: 20 7d 0a 20 20 20 20 20 20 63 61 73 65 20 27 5c   }.      case '\
48b0: 5c 27 3a 20 7b 0a 20 20 20 20 20 20 20 20 69 6e  \': {.        in
48c0: 74 20 73 70 65 63 69 61 6c 4f 70 20 3d 20 30 3b  t specialOp = 0;
48d0: 0a 20 20 20 20 20 20 20 20 73 77 69 74 63 68 28  .        switch(
48e0: 20 72 65 50 65 65 6b 28 70 29 20 29 7b 0a 20 20   rePeek(p) ){.  
48f0: 20 20 20 20 20 20 20 20 63 61 73 65 20 27 62 27          case 'b'
4900: 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45  : specialOp = RE
4910: 5f 4f 50 5f 42 4f 55 4e 44 41 52 59 3b 20 20 20  _OP_BOUNDARY;   
4920: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 20  break;.         
4930: 20 63 61 73 65 20 27 64 27 3a 20 73 70 65 63 69   case 'd': speci
4940: 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f 44 49 47  alOp = RE_OP_DIG
4950: 49 54 3b 20 20 20 20 20 20 62 72 65 61 6b 3b 0a  IT;      break;.
4960: 20 20 20 20 20 20 20 20 20 20 63 61 73 65 20 27            case '
4970: 44 27 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20  D': specialOp = 
4980: 52 45 5f 4f 50 5f 4e 4f 54 44 49 47 49 54 3b 20  RE_OP_NOTDIGIT; 
4990: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20    break;.       
49a0: 20 20 20 63 61 73 65 20 27 73 27 3a 20 73 70 65     case 's': spe
49b0: 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f 53  cialOp = RE_OP_S
49c0: 50 41 43 45 3b 20 20 20 20 20 20 62 72 65 61 6b  PACE;      break
49d0: 3b 0a 20 20 20 20 20 20 20 20 20 20 63 61 73 65  ;.          case
49e0: 20 27 53 27 3a 20 73 70 65 63 69 61 6c 4f 70 20   'S': specialOp 
49f0: 3d 20 52 45 5f 4f 50 5f 4e 4f 54 53 50 41 43 45  = RE_OP_NOTSPACE
4a00: 3b 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20  ;   break;.     
4a10: 20 20 20 20 20 63 61 73 65 20 27 77 27 3a 20 73       case 'w': s
4a20: 70 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f 50  pecialOp = RE_OP
4a30: 5f 57 4f 52 44 3b 20 20 20 20 20 20 20 62 72 65  _WORD;       bre
4a40: 61 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 63 61  ak;.          ca
4a50: 73 65 20 27 57 27 3a 20 73 70 65 63 69 61 6c 4f  se 'W': specialO
4a60: 70 20 3d 20 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52  p = RE_OP_NOTWOR
4a70: 44 3b 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20  D;    break;.   
4a80: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 69       }.        i
4a90: 66 28 20 73 70 65 63 69 61 6c 4f 70 20 29 7b 0a  f( specialOp ){.
4aa0: 20 20 20 20 20 20 20 20 20 20 70 2d 3e 73 49 6e            p->sIn
4ab0: 2e 69 2b 2b 3b 0a 20 20 20 20 20 20 20 20 20 20  .i++;.          
4ac0: 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 73 70 65  re_append(p, spe
4ad0: 63 69 61 6c 4f 70 2c 20 30 29 3b 0a 20 20 20 20  cialOp, 0);.    
4ae0: 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20      }else{.     
4af0: 20 20 20 20 20 63 20 3d 20 72 65 5f 65 73 63 5f       c = re_esc_
4b00: 63 68 61 72 28 70 29 3b 0a 20 20 20 20 20 20 20  char(p);.       
4b10: 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20     re_append(p, 
4b20: 52 45 5f 4f 50 5f 4d 41 54 43 48 2c 20 63 29 3b  RE_OP_MATCH, c);
4b30: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20  .        }.     
4b40: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20     break;.      
4b50: 7d 0a 20 20 20 20 20 20 64 65 66 61 75 6c 74 3a  }.      default:
4b60: 20 7b 0a 20 20 20 20 20 20 20 20 72 65 5f 61 70   {.        re_ap
4b70: 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 4d 41  pend(p, RE_OP_MA
4b80: 54 43 48 2c 20 63 29 3b 0a 20 20 20 20 20 20 20  TCH, c);.       
4b90: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a   break;.      }.
4ba0: 20 20 20 20 7d 0a 20 20 20 20 69 50 72 65 76 20      }.    iPrev 
4bb0: 3d 20 69 53 74 61 72 74 3b 0a 20 20 7d 0a 20 20  = iStart;.  }.  
4bc0: 72 65 74 75 72 6e 20 30 3b 0a 7d 0a 0a 2f 2a 20  return 0;.}../* 
4bd0: 46 72 65 65 20 61 6e 64 20 72 65 63 6c 61 69 6d  Free and reclaim
4be0: 20 61 6c 6c 20 74 68 65 20 6d 65 6d 6f 72 79 20   all the memory 
4bf0: 75 73 65 64 20 62 79 20 61 20 70 72 65 76 69 6f  used by a previo
4c00: 75 73 6c 79 20 63 6f 6d 70 69 6c 65 64 0a 2a 2a  usly compiled.**
4c10: 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73 73   regular express
4c20: 69 6f 6e 2e 20 20 41 70 70 6c 69 63 61 74 69 6f  ion.  Applicatio
4c30: 6e 73 20 73 68 6f 75 6c 64 20 69 6e 76 6f 6b 65  ns should invoke
4c40: 20 74 68 69 73 20 72 6f 75 74 69 6e 65 20 6f 6e   this routine on
4c50: 63 65 0a 2a 2a 20 66 6f 72 20 65 76 65 72 79 20  ce.** for every 
4c60: 63 61 6c 6c 20 74 6f 20 72 65 5f 63 6f 6d 70 69  call to re_compi
4c70: 6c 65 28 29 20 74 6f 20 61 76 6f 69 64 20 6d 65  le() to avoid me
4c80: 6d 6f 72 79 20 6c 65 61 6b 73 2e 0a 2a 2f 0a 76  mory leaks..*/.v
4c90: 6f 69 64 20 72 65 5f 66 72 65 65 28 52 65 43 6f  oid re_free(ReCo
4ca0: 6d 70 69 6c 65 64 20 2a 70 52 65 29 7b 0a 20 20  mpiled *pRe){.  
4cb0: 69 66 28 20 70 52 65 20 29 7b 0a 20 20 20 20 73  if( pRe ){.    s
4cc0: 71 6c 69 74 65 33 5f 66 72 65 65 28 70 52 65 2d  qlite3_free(pRe-
4cd0: 3e 61 4f 70 29 3b 0a 20 20 20 20 73 71 6c 69 74  >aOp);.    sqlit
4ce0: 65 33 5f 66 72 65 65 28 70 52 65 2d 3e 61 41 72  e3_free(pRe->aAr
4cf0: 67 29 3b 0a 20 20 20 20 73 71 6c 69 74 65 33 5f  g);.    sqlite3_
4d00: 66 72 65 65 28 70 52 65 29 3b 0a 20 20 7d 0a 7d  free(pRe);.  }.}
4d10: 0a 0a 2f 2a 0a 2a 2a 20 43 6f 6d 70 69 6c 65 20  ../*.** Compile 
4d20: 61 20 74 65 78 74 75 61 6c 20 72 65 67 75 6c 61  a textual regula
4d30: 72 20 65 78 70 72 65 73 73 69 6f 6e 20 69 6e 20  r expression in 
4d40: 7a 49 6e 5b 5d 20 69 6e 74 6f 20 61 20 63 6f 6d  zIn[] into a com
4d50: 70 69 6c 65 64 20 72 65 67 75 6c 61 72 0a 2a 2a  piled regular.**
4d60: 20 65 78 70 72 65 73 73 69 6f 6e 20 73 75 69 74   expression suit
4d70: 61 62 6c 65 20 66 6f 72 20 75 73 20 62 79 20 72  able for us by r
4d80: 65 5f 6d 61 74 63 68 28 29 20 61 6e 64 20 72 65  e_match() and re
4d90: 74 75 72 6e 20 61 20 70 6f 69 6e 74 65 72 20 74  turn a pointer t
4da0: 6f 20 74 68 65 0a 2a 2a 20 63 6f 6d 70 69 6c 65  o the.** compile
4db0: 64 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73  d regular expres
4dc0: 73 69 6f 6e 20 69 6e 20 2a 70 70 52 65 2e 20 20  sion in *ppRe.  
4dd0: 52 65 74 75 72 6e 20 4e 55 4c 4c 20 6f 6e 20 73  Return NULL on s
4de0: 75 63 63 65 73 73 20 6f 72 20 61 6e 0a 2a 2a 20  uccess or an.** 
4df0: 65 72 72 6f 72 20 6d 65 73 73 61 67 65 20 69 66  error message if
4e00: 20 73 6f 6d 65 74 68 69 6e 67 20 67 6f 65 73 20   something goes 
4e10: 77 72 6f 6e 67 2e 0a 2a 2f 0a 63 6f 6e 73 74 20  wrong..*/.const 
4e20: 63 68 61 72 20 2a 72 65 5f 63 6f 6d 70 69 6c 65  char *re_compile
4e30: 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a 2a 70 70  (ReCompiled **pp
4e40: 52 65 2c 20 63 6f 6e 73 74 20 63 68 61 72 20 2a  Re, const char *
4e50: 7a 49 6e 2c 20 69 6e 74 20 6e 6f 43 61 73 65 29  zIn, int noCase)
4e60: 7b 0a 20 20 52 65 43 6f 6d 70 69 6c 65 64 20 2a  {.  ReCompiled *
4e70: 70 52 65 3b 0a 20 20 63 6f 6e 73 74 20 63 68 61  pRe;.  const cha
4e80: 72 20 2a 7a 45 72 72 3b 0a 20 20 69 6e 74 20 69  r *zErr;.  int i
4e90: 2c 20 6a 3b 0a 0a 20 20 2a 70 70 52 65 20 3d 20  , j;..  *ppRe = 
4ea0: 30 3b 0a 20 20 70 52 65 20 3d 20 73 71 6c 69 74  0;.  pRe = sqlit
4eb0: 65 33 5f 6d 61 6c 6c 6f 63 28 20 73 69 7a 65 6f  e3_malloc( sizeo
4ec0: 66 28 2a 70 52 65 29 20 29 3b 0a 20 20 69 66 28  f(*pRe) );.  if(
4ed0: 20 70 52 65 3d 3d 30 20 29 7b 0a 20 20 20 20 72   pRe==0 ){.    r
4ee0: 65 74 75 72 6e 20 22 6f 75 74 20 6f 66 20 6d 65  eturn "out of me
4ef0: 6d 6f 72 79 22 3b 0a 20 20 7d 0a 20 20 6d 65 6d  mory";.  }.  mem
4f00: 73 65 74 28 70 52 65 2c 20 30 2c 20 73 69 7a 65  set(pRe, 0, size
4f10: 6f 66 28 2a 70 52 65 29 29 3b 0a 20 20 70 52 65  of(*pRe));.  pRe
4f20: 2d 3e 78 4e 65 78 74 43 68 61 72 20 3d 20 6e 6f  ->xNextChar = no
4f30: 43 61 73 65 20 3f 20 72 65 5f 6e 65 78 74 5f 63  Case ? re_next_c
4f40: 68 61 72 5f 6e 6f 63 61 73 65 20 3a 20 72 65 5f  har_nocase : re_
4f50: 6e 65 78 74 5f 63 68 61 72 3b 0a 20 20 69 66 28  next_char;.  if(
4f60: 20 72 65 5f 72 65 73 69 7a 65 28 70 52 65 2c 20   re_resize(pRe, 
4f70: 33 30 29 20 29 7b 0a 20 20 20 20 72 65 5f 66 72  30) ){.    re_fr
4f80: 65 65 28 70 52 65 29 3b 0a 20 20 20 20 72 65 74  ee(pRe);.    ret
4f90: 75 72 6e 20 22 6f 75 74 20 6f 66 20 6d 65 6d 6f  urn "out of memo
4fa0: 72 79 22 3b 0a 20 20 7d 0a 20 20 69 66 28 20 7a  ry";.  }.  if( z
4fb0: 49 6e 5b 30 5d 3d 3d 27 5e 27 20 29 7b 0a 20 20  In[0]=='^' ){.  
4fc0: 20 20 7a 49 6e 2b 2b 3b 0a 20 20 7d 65 6c 73 65    zIn++;.  }else
4fd0: 7b 0a 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28  {.    re_append(
4fe0: 70 52 65 2c 20 52 45 5f 4f 50 5f 41 4e 59 53 54  pRe, RE_OP_ANYST
4ff0: 41 52 2c 20 30 29 3b 0a 20 20 7d 0a 20 20 70 52  AR, 0);.  }.  pR
5000: 65 2d 3e 73 49 6e 2e 7a 20 3d 20 28 75 6e 73 69  e->sIn.z = (unsi
5010: 67 6e 65 64 20 63 68 61 72 2a 29 7a 49 6e 3b 0a  gned char*)zIn;.
5020: 20 20 70 52 65 2d 3e 73 49 6e 2e 69 20 3d 20 30    pRe->sIn.i = 0
5030: 3b 0a 20 20 70 52 65 2d 3e 73 49 6e 2e 6d 78 20  ;.  pRe->sIn.mx 
5040: 3d 20 28 69 6e 74 29 73 74 72 6c 65 6e 28 7a 49  = (int)strlen(zI
5050: 6e 29 3b 0a 20 20 7a 45 72 72 20 3d 20 72 65 5f  n);.  zErr = re_
5060: 73 75 62 63 6f 6d 70 69 6c 65 5f 72 65 28 70 52  subcompile_re(pR
5070: 65 29 3b 0a 20 20 69 66 28 20 7a 45 72 72 20 29  e);.  if( zErr )
5080: 7b 0a 20 20 20 20 72 65 5f 66 72 65 65 28 70 52  {.    re_free(pR
5090: 65 29 3b 0a 20 20 20 20 72 65 74 75 72 6e 20 7a  e);.    return z
50a0: 45 72 72 3b 0a 20 20 7d 0a 20 20 69 66 28 20 72  Err;.  }.  if( r
50b0: 65 50 65 65 6b 28 70 52 65 29 3d 3d 27 24 27 20  ePeek(pRe)=='$' 
50c0: 26 26 20 70 52 65 2d 3e 73 49 6e 2e 69 2b 31 3e  && pRe->sIn.i+1>
50d0: 3d 70 52 65 2d 3e 73 49 6e 2e 6d 78 20 29 7b 0a  =pRe->sIn.mx ){.
50e0: 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 52      re_append(pR
50f0: 65 2c 20 52 45 5f 4f 50 5f 4d 41 54 43 48 2c 20  e, RE_OP_MATCH, 
5100: 52 45 5f 45 4f 46 29 3b 0a 20 20 20 20 72 65 5f  RE_EOF);.    re_
5110: 61 70 70 65 6e 64 28 70 52 65 2c 20 52 45 5f 4f  append(pRe, RE_O
5120: 50 5f 41 43 43 45 50 54 2c 20 30 29 3b 0a 20 20  P_ACCEPT, 0);.  
5130: 20 20 2a 70 70 52 65 20 3d 20 70 52 65 3b 0a 20    *ppRe = pRe;. 
5140: 20 7d 65 6c 73 65 20 69 66 28 20 70 52 65 2d 3e   }else if( pRe->
5150: 73 49 6e 2e 69 3e 3d 70 52 65 2d 3e 73 49 6e 2e  sIn.i>=pRe->sIn.
5160: 6d 78 20 29 7b 0a 20 20 20 20 72 65 5f 61 70 70  mx ){.    re_app
5170: 65 6e 64 28 70 52 65 2c 20 52 45 5f 4f 50 5f 41  end(pRe, RE_OP_A
5180: 43 43 45 50 54 2c 20 30 29 3b 0a 20 20 20 20 2a  CCEPT, 0);.    *
5190: 70 70 52 65 20 3d 20 70 52 65 3b 0a 20 20 7d 65  ppRe = pRe;.  }e
51a0: 6c 73 65 7b 0a 20 20 20 20 72 65 5f 66 72 65 65  lse{.    re_free
51b0: 28 70 52 65 29 3b 0a 20 20 20 20 72 65 74 75 72  (pRe);.    retur
51c0: 6e 20 22 75 6e 72 65 63 6f 67 6e 69 7a 65 64 20  n "unrecognized 
51d0: 63 68 61 72 61 63 74 65 72 22 3b 0a 20 20 7d 0a  character";.  }.
51e0: 0a 20 20 2f 2a 20 54 68 65 20 66 6f 6c 6c 6f 77  .  /* The follow
51f0: 69 6e 67 20 69 73 20 61 20 70 65 72 66 6f 72 6d  ing is a perform
5200: 61 6e 63 65 20 6f 70 74 69 6d 69 7a 61 74 69 6f  ance optimizatio
5210: 6e 2e 20 20 49 66 20 74 68 65 20 72 65 67 65 78  n.  If the regex
5220: 20 62 65 67 69 6e 73 20 77 69 74 68 0a 20 20 2a   begins with.  *
5230: 2a 20 22 2e 2a 22 20 28 69 66 20 74 68 65 20 69  * ".*" (if the i
5240: 6e 70 75 74 20 72 65 67 65 78 20 6c 61 63 6b 73  nput regex lacks
5250: 20 61 6e 20 69 6e 69 74 69 61 6c 20 22 5e 22 29   an initial "^")
5260: 20 61 6e 64 20 61 66 74 65 72 77 61 72 64 73 20   and afterwards 
5270: 74 68 65 72 65 20 61 72 65 0a 20 20 2a 2a 20 6f  there are.  ** o
5280: 6e 65 20 6f 72 20 6d 6f 72 65 20 6d 61 74 63 68  ne or more match
5290: 69 6e 67 20 63 68 61 72 61 63 74 65 72 73 2c 20  ing characters, 
52a0: 65 6e 74 65 72 20 74 68 6f 73 65 20 6d 61 74 63  enter those matc
52b0: 68 69 6e 67 20 63 68 61 72 61 63 74 65 72 73 20  hing characters 
52c0: 69 6e 74 6f 0a 20 20 2a 2a 20 7a 49 6e 69 74 5b  into.  ** zInit[
52d0: 5d 2e 20 20 54 68 65 20 72 65 5f 6d 61 74 63 68  ].  The re_match
52e0: 28 29 20 72 6f 75 74 69 6e 65 20 63 61 6e 20 74  () routine can t
52f0: 68 65 6e 20 73 65 61 72 63 68 20 61 68 65 61 64  hen search ahead
5300: 20 69 6e 20 74 68 65 20 69 6e 70 75 74 20 0a 20   in the input . 
5310: 20 2a 2a 20 73 74 72 69 6e 67 20 6c 6f 6f 6b 69   ** string looki
5320: 6e 67 20 66 6f 72 20 74 68 65 20 69 6e 69 74 69  ng for the initi
5330: 61 6c 20 6d 61 74 63 68 20 77 69 74 68 6f 75 74  al match without
5340: 20 68 61 76 69 6e 67 20 74 6f 20 72 75 6e 20 74   having to run t
5350: 68 65 20 77 68 6f 6c 65 0a 20 20 2a 2a 20 72 65  he whole.  ** re
5360: 67 65 78 20 65 6e 67 69 6e 65 20 6f 76 65 72 20  gex engine over 
5370: 74 68 65 20 73 74 72 69 6e 67 2e 20 20 44 6f 20  the string.  Do 
5380: 6e 6f 74 20 77 6f 72 72 79 20 61 62 6c 65 20 74  not worry able t
5390: 72 79 69 6e 67 20 74 6f 20 6d 61 74 63 68 0a 20  rying to match. 
53a0: 20 2a 2a 20 75 6e 69 63 6f 64 65 20 63 68 61 72   ** unicode char
53b0: 61 63 74 65 72 73 20 62 65 79 6f 6e 64 20 70 6c  acters beyond pl
53c0: 61 6e 65 20 30 20 2d 20 74 68 6f 73 65 20 61 72  ane 0 - those ar
53d0: 65 20 76 65 72 79 20 72 61 72 65 20 61 6e 64 20  e very rare and 
53e0: 74 68 69 73 20 69 73 0a 20 20 2a 2a 20 6a 75 73  this is.  ** jus
53f0: 74 20 61 6e 20 6f 70 74 69 6d 69 7a 61 74 69 6f  t an optimizatio
5400: 6e 2e 20 2a 2f 0a 20 20 69 66 28 20 70 52 65 2d  n. */.  if( pRe-
5410: 3e 61 4f 70 5b 30 5d 3d 3d 52 45 5f 4f 50 5f 41  >aOp[0]==RE_OP_A
5420: 4e 59 53 54 41 52 20 29 7b 0a 20 20 20 20 66 6f  NYSTAR ){.    fo
5430: 72 28 6a 3d 30 2c 20 69 3d 31 3b 20 6a 3c 73 69  r(j=0, i=1; j<si
5440: 7a 65 6f 66 28 70 52 65 2d 3e 7a 49 6e 69 74 29  zeof(pRe->zInit)
5450: 2d 32 20 26 26 20 70 52 65 2d 3e 61 4f 70 5b 69  -2 && pRe->aOp[i
5460: 5d 3d 3d 52 45 5f 4f 50 5f 4d 41 54 43 48 3b 20  ]==RE_OP_MATCH; 
5470: 69 2b 2b 29 7b 0a 20 20 20 20 20 20 75 6e 73 69  i++){.      unsi
5480: 67 6e 65 64 20 78 20 3d 20 70 52 65 2d 3e 61 41  gned x = pRe->aA
5490: 72 67 5b 69 5d 3b 0a 20 20 20 20 20 20 69 66 28  rg[i];.      if(
54a0: 20 78 3c 3d 31 32 37 20 29 7b 0a 20 20 20 20 20   x<=127 ){.     
54b0: 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b     pRe->zInit[j+
54c0: 2b 5d 20 3d 20 78 3b 0a 20 20 20 20 20 20 7d 65  +] = x;.      }e
54d0: 6c 73 65 20 69 66 28 20 78 3c 3d 30 78 66 66 66  lse if( x<=0xfff
54e0: 20 29 7b 0a 20 20 20 20 20 20 20 20 70 52 65 2d   ){.        pRe-
54f0: 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 30 78  >zInit[j++] = 0x
5500: 63 30 20 7c 20 28 78 3e 3e 36 29 3b 0a 20 20 20  c0 | (x>>6);.   
5510: 20 20 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b       pRe->zInit[
5520: 6a 2b 2b 5d 20 3d 20 30 78 38 30 20 7c 20 28 78  j++] = 0x80 | (x
5530: 26 30 78 33 66 29 3b 0a 20 20 20 20 20 20 7d 65  &0x3f);.      }e
5540: 6c 73 65 20 69 66 28 20 78 3c 3d 30 78 66 66 66  lse if( x<=0xfff
5550: 66 20 29 7b 0a 20 20 20 20 20 20 20 20 70 52 65  f ){.        pRe
5560: 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 30  ->zInit[j++] = 0
5570: 78 64 30 20 7c 20 28 78 3e 3e 31 32 29 3b 0a 20  xd0 | (x>>12);. 
5580: 20 20 20 20 20 20 20 70 52 65 2d 3e 7a 49 6e 69         pRe->zIni
5590: 74 5b 6a 2b 2b 5d 20 3d 20 30 78 38 30 20 7c 20  t[j++] = 0x80 | 
55a0: 28 28 78 3e 3e 36 29 26 30 78 33 66 29 3b 0a 20  ((x>>6)&0x3f);. 
55b0: 20 20 20 20 20 20 20 70 52 65 2d 3e 7a 49 6e 69         pRe->zIni
55c0: 74 5b 6a 2b 2b 5d 20 3d 20 30 78 38 30 20 7c 20  t[j++] = 0x80 | 
55d0: 28 78 26 30 78 33 66 29 3b 0a 20 20 20 20 20 20  (x&0x3f);.      
55e0: 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 62  }else{.        b
55f0: 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20  reak;.      }.  
5600: 20 20 7d 0a 20 20 20 20 69 66 28 20 6a 3e 30 20    }.    if( j>0 
5610: 26 26 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2d  && pRe->zInit[j-
5620: 31 5d 3d 3d 30 20 29 20 6a 2d 2d 3b 0a 20 20 20  1]==0 ) j--;.   
5630: 20 70 52 65 2d 3e 6e 49 6e 69 74 20 3d 20 6a 3b   pRe->nInit = j;
5640: 0a 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 70 52  .  }.  return pR
5650: 65 2d 3e 7a 45 72 72 3b 0a 7d 0a 0a 2f 2a 0a 2a  e->zErr;.}../*.*
5660: 2a 20 49 6d 70 6c 65 6d 65 6e 74 61 74 69 6f 6e  * Implementation
5670: 20 6f 66 20 74 68 65 20 72 65 67 65 78 70 28 29   of the regexp()
5680: 20 53 51 4c 20 66 75 6e 63 74 69 6f 6e 2e 20 20   SQL function.  
5690: 54 68 69 73 20 66 75 6e 63 74 69 6f 6e 20 69 6d  This function im
56a0: 70 6c 65 6d 65 6e 74 73 0a 2a 2a 20 74 68 65 20  plements.** the 
56b0: 62 75 69 6c 64 2d 69 6e 20 52 45 47 45 58 50 20  build-in REGEXP 
56c0: 6f 70 65 72 61 74 6f 72 2e 20 20 54 68 65 20 66  operator.  The f
56d0: 69 72 73 74 20 61 72 67 75 6d 65 6e 74 20 74 6f  irst argument to
56e0: 20 74 68 65 20 66 75 6e 63 74 69 6f 6e 20 69 73   the function is
56f0: 20 74 68 65 0a 2a 2a 20 70 61 74 74 65 72 6e 20   the.** pattern 
5700: 61 6e 64 20 74 68 65 20 73 65 63 6f 6e 64 20 61  and the second a
5710: 72 67 75 6d 65 6e 74 20 69 73 20 74 68 65 20 73  rgument is the s
5720: 74 72 69 6e 67 2e 20 20 53 6f 2c 20 74 68 65 20  tring.  So, the 
5730: 53 51 4c 20 73 74 61 74 65 6d 65 6e 74 73 3a 0a  SQL statements:.
5740: 2a 2a 0a 2a 2a 20 20 20 20 20 20 20 41 20 52 45  **.**       A RE
5750: 47 45 58 50 20 42 0a 2a 2a 0a 2a 2a 20 69 73 20  GEXP B.**.** is 
5760: 69 6d 70 6c 65 6d 65 6e 74 65 64 20 61 73 20 72  implemented as r
5770: 65 67 65 78 70 28 42 2c 41 29 2e 0a 2a 2f 0a 73  egexp(B,A)..*/.s
5780: 74 61 74 69 63 20 76 6f 69 64 20 72 65 5f 73 71  tatic void re_sq
5790: 6c 5f 66 75 6e 63 28 0a 20 20 73 71 6c 69 74 65  l_func(.  sqlite
57a0: 33 5f 63 6f 6e 74 65 78 74 20 2a 63 6f 6e 74 65  3_context *conte
57b0: 78 74 2c 20 0a 20 20 69 6e 74 20 61 72 67 63 2c  xt, .  int argc,
57c0: 20 0a 20 20 73 71 6c 69 74 65 33 5f 76 61 6c 75   .  sqlite3_valu
57d0: 65 20 2a 2a 61 72 67 76 0a 29 7b 0a 20 20 52 65  e **argv.){.  Re
57e0: 43 6f 6d 70 69 6c 65 64 20 2a 70 52 65 3b 20 20  Compiled *pRe;  
57f0: 20 20 20 20 20 20 20 20 2f 2a 20 43 6f 6d 70 69          /* Compi
5800: 6c 65 64 20 72 65 67 75 6c 61 72 20 65 78 70 72  led regular expr
5810: 65 73 73 69 6f 6e 20 2a 2f 0a 20 20 63 6f 6e 73  ession */.  cons
5820: 74 20 63 68 61 72 20 2a 7a 50 61 74 74 65 72 6e  t char *zPattern
5830: 3b 20 20 20 20 20 2f 2a 20 54 68 65 20 72 65 67  ;     /* The reg
5840: 75 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20  ular expression 
5850: 2a 2f 0a 20 20 63 6f 6e 73 74 20 75 6e 73 69 67  */.  const unsig
5860: 6e 65 64 20 63 68 61 72 20 2a 7a 53 74 72 3b 2f  ned char *zStr;/
5870: 2a 20 53 74 72 69 6e 67 20 62 65 69 6e 67 20 73  * String being s
5880: 65 61 72 63 68 65 64 20 2a 2f 0a 20 20 63 6f 6e  earched */.  con
5890: 73 74 20 63 68 61 72 20 2a 7a 45 72 72 3b 20 20  st char *zErr;  
58a0: 20 20 20 20 20 20 20 2f 2a 20 43 6f 6d 70 69 6c         /* Compil
58b0: 65 20 65 72 72 6f 72 20 6d 65 73 73 61 67 65 20  e error message 
58c0: 2a 2f 0a 20 20 69 6e 74 20 73 65 74 41 75 78 20  */.  int setAux 
58d0: 3d 20 30 3b 20 20 20 20 20 20 20 20 20 20 20 2f  = 0;           /
58e0: 2a 20 54 72 75 65 20 74 6f 20 69 6e 76 6f 6b 65  * True to invoke
58f0: 20 73 71 6c 69 74 65 33 5f 73 65 74 5f 61 75 78   sqlite3_set_aux
5900: 64 61 74 61 28 29 20 2a 2f 0a 0a 20 20 70 52 65  data() */..  pRe
5910: 20 3d 20 73 71 6c 69 74 65 33 5f 67 65 74 5f 61   = sqlite3_get_a
5920: 75 78 64 61 74 61 28 63 6f 6e 74 65 78 74 2c 20  uxdata(context, 
5930: 30 29 3b 0a 20 20 69 66 28 20 70 52 65 3d 3d 30  0);.  if( pRe==0
5940: 20 29 7b 0a 20 20 20 20 7a 50 61 74 74 65 72 6e   ){.    zPattern
5950: 20 3d 20 28 63 6f 6e 73 74 20 63 68 61 72 2a 29   = (const char*)
5960: 73 71 6c 69 74 65 33 5f 76 61 6c 75 65 5f 74 65  sqlite3_value_te
5970: 78 74 28 61 72 67 76 5b 30 5d 29 3b 0a 20 20 20  xt(argv[0]);.   
5980: 20 69 66 28 20 7a 50 61 74 74 65 72 6e 3d 3d 30   if( zPattern==0
5990: 20 29 20 72 65 74 75 72 6e 3b 0a 20 20 20 20 7a   ) return;.    z
59a0: 45 72 72 20 3d 20 72 65 5f 63 6f 6d 70 69 6c 65  Err = re_compile
59b0: 28 26 70 52 65 2c 20 7a 50 61 74 74 65 72 6e 2c  (&pRe, zPattern,
59c0: 20 30 29 3b 0a 20 20 20 20 69 66 28 20 7a 45 72   0);.    if( zEr
59d0: 72 20 29 7b 0a 20 20 20 20 20 20 72 65 5f 66 72  r ){.      re_fr
59e0: 65 65 28 70 52 65 29 3b 0a 20 20 20 20 20 20 73  ee(pRe);.      s
59f0: 71 6c 69 74 65 33 5f 72 65 73 75 6c 74 5f 65 72  qlite3_result_er
5a00: 72 6f 72 28 63 6f 6e 74 65 78 74 2c 20 7a 45 72  ror(context, zEr
5a10: 72 2c 20 2d 31 29 3b 0a 20 20 20 20 20 20 72 65  r, -1);.      re
5a20: 74 75 72 6e 3b 0a 20 20 20 20 7d 0a 20 20 20 20  turn;.    }.    
5a30: 69 66 28 20 70 52 65 3d 3d 30 20 29 7b 0a 20 20  if( pRe==0 ){.  
5a40: 20 20 20 20 73 71 6c 69 74 65 33 5f 72 65 73 75      sqlite3_resu
5a50: 6c 74 5f 65 72 72 6f 72 5f 6e 6f 6d 65 6d 28 63  lt_error_nomem(c
5a60: 6f 6e 74 65 78 74 29 3b 0a 20 20 20 20 20 20 72  ontext);.      r
5a70: 65 74 75 72 6e 3b 0a 20 20 20 20 7d 0a 20 20 20  eturn;.    }.   
5a80: 20 73 65 74 41 75 78 20 3d 20 31 3b 0a 20 20 7d   setAux = 1;.  }
5a90: 0a 20 20 7a 53 74 72 20 3d 20 28 63 6f 6e 73 74  .  zStr = (const
5aa0: 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 2a 29   unsigned char*)
5ab0: 73 71 6c 69 74 65 33 5f 76 61 6c 75 65 5f 74 65  sqlite3_value_te
5ac0: 78 74 28 61 72 67 76 5b 31 5d 29 3b 0a 20 20 69  xt(argv[1]);.  i
5ad0: 66 28 20 7a 53 74 72 21 3d 30 20 29 7b 0a 20 20  f( zStr!=0 ){.  
5ae0: 20 20 73 71 6c 69 74 65 33 5f 72 65 73 75 6c 74    sqlite3_result
5af0: 5f 69 6e 74 28 63 6f 6e 74 65 78 74 2c 20 72 65  _int(context, re
5b00: 5f 6d 61 74 63 68 28 70 52 65 2c 20 7a 53 74 72  _match(pRe, zStr
5b10: 2c 20 2d 31 29 29 3b 0a 20 20 7d 0a 20 20 69 66  , -1));.  }.  if
5b20: 28 20 73 65 74 41 75 78 20 29 7b 0a 20 20 20 20  ( setAux ){.    
5b30: 73 71 6c 69 74 65 33 5f 73 65 74 5f 61 75 78 64  sqlite3_set_auxd
5b40: 61 74 61 28 63 6f 6e 74 65 78 74 2c 20 30 2c 20  ata(context, 0, 
5b50: 70 52 65 2c 20 28 76 6f 69 64 28 2a 29 28 76 6f  pRe, (void(*)(vo
5b60: 69 64 2a 29 29 72 65 5f 66 72 65 65 29 3b 0a 20  id*))re_free);. 
5b70: 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 49 6e 76 6f   }.}../*.** Invo
5b80: 6b 65 20 74 68 69 73 20 72 6f 75 74 69 6e 65 20  ke this routine 
5b90: 74 6f 20 72 65 67 69 73 74 65 72 20 74 68 65 20  to register the 
5ba0: 72 65 67 65 78 70 28 29 20 66 75 6e 63 74 69 6f  regexp() functio
5bb0: 6e 20 77 69 74 68 20 74 68 65 0a 2a 2a 20 53 51  n with the.** SQ
5bc0: 4c 69 74 65 20 64 61 74 61 62 61 73 65 20 63 6f  Lite database co
5bd0: 6e 6e 65 63 74 69 6f 6e 2e 0a 2a 2f 0a 23 69 66  nnection..*/.#if
5be0: 64 65 66 20 5f 57 49 4e 33 32 0a 5f 5f 64 65 63  def _WIN32.__dec
5bf0: 6c 73 70 65 63 28 64 6c 6c 65 78 70 6f 72 74 29  lspec(dllexport)
5c00: 0a 23 65 6e 64 69 66 0a 69 6e 74 20 73 71 6c 69  .#endif.int sqli
5c10: 74 65 33 5f 72 65 67 65 78 70 5f 69 6e 69 74 28  te3_regexp_init(
5c20: 0a 20 20 73 71 6c 69 74 65 33 20 2a 64 62 2c 20  .  sqlite3 *db, 
5c30: 0a 20 20 63 68 61 72 20 2a 2a 70 7a 45 72 72 4d  .  char **pzErrM
5c40: 73 67 2c 20 0a 20 20 63 6f 6e 73 74 20 73 71 6c  sg, .  const sql
5c50: 69 74 65 33 5f 61 70 69 5f 72 6f 75 74 69 6e 65  ite3_api_routine
5c60: 73 20 2a 70 41 70 69 0a 29 7b 0a 20 20 69 6e 74  s *pApi.){.  int
5c70: 20 72 63 20 3d 20 53 51 4c 49 54 45 5f 4f 4b 3b   rc = SQLITE_OK;
5c80: 0a 20 20 53 51 4c 49 54 45 5f 45 58 54 45 4e 53  .  SQLITE_EXTENS
5c90: 49 4f 4e 5f 49 4e 49 54 32 28 70 41 70 69 29 3b  ION_INIT2(pApi);
5ca0: 0a 20 20 72 63 20 3d 20 73 71 6c 69 74 65 33 5f  .  rc = sqlite3_
5cb0: 63 72 65 61 74 65 5f 66 75 6e 63 74 69 6f 6e 28  create_function(
5cc0: 64 62 2c 20 22 72 65 67 65 78 70 22 2c 20 32 2c  db, "regexp", 2,
5cd0: 20 53 51 4c 49 54 45 5f 55 54 46 38 2c 20 30 2c   SQLITE_UTF8, 0,
5ce0: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
5cf0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
5d00: 20 20 72 65 5f 73 71 6c 5f 66 75 6e 63 2c 20 30    re_sql_func, 0
5d10: 2c 20 30 29 3b 0a 20 20 72 65 74 75 72 6e 20 72  , 0);.  return r
5d20: 63 3b 0a 7d 0a                                   c;.}.