/ Hex Artifact Content
Login

Artifact 79345bf03496155a640ee0300d3307296761cebb5e115b4e342cc2fb5861ec10:


0000: 2f 2a 0a 2a 2a 20 32 30 31 32 2d 31 31 2d 31 33  /*.** 2012-11-13
0010: 0a 2a 2a 0a 2a 2a 20 54 68 65 20 61 75 74 68 6f  .**.** The autho
0020: 72 20 64 69 73 63 6c 61 69 6d 73 20 63 6f 70 79  r disclaims copy
0030: 72 69 67 68 74 20 74 6f 20 74 68 69 73 20 73 6f  right to this so
0040: 75 72 63 65 20 63 6f 64 65 2e 20 20 49 6e 20 70  urce code.  In p
0050: 6c 61 63 65 20 6f 66 0a 2a 2a 20 61 20 6c 65 67  lace of.** a leg
0060: 61 6c 20 6e 6f 74 69 63 65 2c 20 68 65 72 65 20  al notice, here 
0070: 69 73 20 61 20 62 6c 65 73 73 69 6e 67 3a 0a 2a  is a blessing:.*
0080: 2a 0a 2a 2a 20 20 20 20 4d 61 79 20 79 6f 75 20  *.**    May you 
0090: 64 6f 20 67 6f 6f 64 20 61 6e 64 20 6e 6f 74 20  do good and not 
00a0: 65 76 69 6c 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  evil..**    May 
00b0: 79 6f 75 20 66 69 6e 64 20 66 6f 72 67 69 76 65  you find forgive
00c0: 6e 65 73 73 20 66 6f 72 20 79 6f 75 72 73 65 6c  ness for yoursel
00d0: 66 20 61 6e 64 20 66 6f 72 67 69 76 65 20 6f 74  f and forgive ot
00e0: 68 65 72 73 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  hers..**    May 
00f0: 79 6f 75 20 73 68 61 72 65 20 66 72 65 65 6c 79  you share freely
0100: 2c 20 6e 65 76 65 72 20 74 61 6b 69 6e 67 20 6d  , never taking m
0110: 6f 72 65 20 74 68 61 6e 20 79 6f 75 20 67 69 76  ore than you giv
0120: 65 2e 0a 2a 2a 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  e..**.**********
0130: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0140: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0150: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0160: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0170: 2a 2a 2a 2a 0a 2a 2a 0a 2a 2a 20 54 68 65 20 63  ****.**.** The c
0180: 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c 65  ode in this file
0190: 20 69 6d 70 6c 65 6d 65 6e 74 73 20 61 20 63 6f   implements a co
01a0: 6d 70 61 63 74 20 62 75 74 20 72 65 61 73 6f 6e  mpact but reason
01b0: 61 62 6c 79 0a 2a 2a 20 65 66 66 69 63 69 65 6e  ably.** efficien
01c0: 74 20 72 65 67 75 6c 61 72 2d 65 78 70 72 65 73  t regular-expres
01d0: 73 69 6f 6e 20 6d 61 74 63 68 65 72 20 66 6f 72  sion matcher for
01e0: 20 70 6f 73 69 78 20 65 78 74 65 6e 64 65 64 20   posix extended 
01f0: 72 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70 72 65  regular.** expre
0200: 73 73 69 6f 6e 73 20 61 67 61 69 6e 73 74 20 55  ssions against U
0210: 54 46 38 20 74 65 78 74 2e 0a 2a 2a 0a 2a 2a 20  TF8 text..**.** 
0220: 54 68 69 73 20 66 69 6c 65 20 69 73 20 61 6e 20  This file is an 
0230: 53 51 4c 69 74 65 20 65 78 74 65 6e 73 69 6f 6e  SQLite extension
0240: 2e 20 20 49 74 20 72 65 67 69 73 74 65 72 73 20  .  It registers 
0250: 61 20 73 69 6e 67 6c 65 20 66 75 6e 63 74 69 6f  a single functio
0260: 6e 0a 2a 2a 20 6e 61 6d 65 64 20 22 72 65 67 65  n.** named "rege
0270: 78 70 28 41 2c 42 29 22 20 77 68 65 72 65 20 41  xp(A,B)" where A
0280: 20 69 73 20 74 68 65 20 72 65 67 75 6c 61 72 20   is the regular 
0290: 65 78 70 72 65 73 73 69 6f 6e 20 61 6e 64 20 42  expression and B
02a0: 20 69 73 20 74 68 65 0a 2a 2a 20 73 74 72 69 6e   is the.** strin
02b0: 67 20 74 6f 20 62 65 20 6d 61 74 63 68 65 64 2e  g to be matched.
02c0: 20 20 42 79 20 72 65 67 69 73 74 65 72 69 6e 67    By registering
02d0: 20 74 68 69 73 20 66 75 6e 63 74 69 6f 6e 2c 20   this function, 
02e0: 53 51 4c 69 74 65 20 77 69 6c 6c 20 61 6c 73 6f  SQLite will also
02f0: 0a 2a 2a 20 74 68 65 6e 20 69 6d 70 6c 65 6d 65  .** then impleme
0300: 6e 74 20 74 68 65 20 22 42 20 72 65 67 65 78 70  nt the "B regexp
0310: 20 41 22 20 6f 70 65 72 61 74 6f 72 2e 20 20 4e   A" operator.  N
0320: 6f 74 65 20 74 68 61 74 20 77 69 74 68 20 74 68  ote that with th
0330: 65 20 66 75 6e 63 74 69 6f 6e 0a 2a 2a 20 74 68  e function.** th
0340: 65 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73  e regular expres
0350: 73 69 6f 6e 20 63 6f 6d 65 73 20 66 69 72 73 74  sion comes first
0360: 2c 20 62 75 74 20 77 69 74 68 20 74 68 65 20 6f  , but with the o
0370: 70 65 72 61 74 6f 72 20 69 74 20 63 6f 6d 65 73  perator it comes
0380: 0a 2a 2a 20 73 65 63 6f 6e 64 2e 0a 2a 2a 0a 2a  .** second..**.*
0390: 2a 20 20 54 68 65 20 66 6f 6c 6c 6f 77 69 6e 67  *  The following
03a0: 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73 73   regular express
03b0: 69 6f 6e 20 73 79 6e 74 61 78 20 69 73 20 73 75  ion syntax is su
03c0: 70 70 6f 72 74 65 64 3a 0a 2a 2a 0a 2a 2a 20 20  pported:.**.**  
03d0: 20 20 20 58 2a 20 20 20 20 20 20 7a 65 72 6f 20     X*      zero 
03e0: 6f 72 20 6d 6f 72 65 20 6f 63 63 75 72 72 65 6e  or more occurren
03f0: 63 65 73 20 6f 66 20 58 0a 2a 2a 20 20 20 20 20  ces of X.**     
0400: 58 2b 20 20 20 20 20 20 6f 6e 65 20 6f 72 20 6d  X+      one or m
0410: 6f 72 65 20 6f 63 63 75 72 72 65 6e 63 65 73 20  ore occurrences 
0420: 6f 66 20 58 0a 2a 2a 20 20 20 20 20 58 3f 20 20  of X.**     X?  
0430: 20 20 20 20 7a 65 72 6f 20 6f 72 20 6f 6e 65 20      zero or one 
0440: 6f 63 63 75 72 72 65 6e 63 65 73 20 6f 66 20 58  occurrences of X
0450: 0a 2a 2a 20 20 20 20 20 58 7b 70 2c 71 7d 20 20  .**     X{p,q}  
0460: 62 65 74 77 65 65 6e 20 70 20 61 6e 64 20 71 20  between p and q 
0470: 6f 63 63 75 72 72 65 6e 63 65 73 20 6f 66 20 58  occurrences of X
0480: 0a 2a 2a 20 20 20 20 20 28 58 29 20 20 20 20 20  .**     (X)     
0490: 6d 61 74 63 68 20 58 0a 2a 2a 20 20 20 20 20 58  match X.**     X
04a0: 7c 59 20 20 20 20 20 58 20 6f 72 20 59 0a 2a 2a  |Y     X or Y.**
04b0: 20 20 20 20 20 5e 58 20 20 20 20 20 20 58 20 6f       ^X      X o
04c0: 63 63 75 72 72 69 6e 67 20 61 74 20 74 68 65 20  ccurring at the 
04d0: 62 65 67 69 6e 6e 69 6e 67 20 6f 66 20 74 68 65  beginning of the
04e0: 20 73 74 72 69 6e 67 0a 2a 2a 20 20 20 20 20 58   string.**     X
04f0: 24 20 20 20 20 20 20 58 20 6f 63 63 75 72 72 69  $      X occurri
0500: 6e 67 20 61 74 20 74 68 65 20 65 6e 64 20 6f 66  ng at the end of
0510: 20 74 68 65 20 73 74 72 69 6e 67 0a 2a 2a 20 20   the string.**  
0520: 20 20 20 2e 20 20 20 20 20 20 20 4d 61 74 63 68     .       Match
0530: 20 61 6e 79 20 73 69 6e 67 6c 65 20 63 68 61 72   any single char
0540: 61 63 74 65 72 0a 2a 2a 20 20 20 20 20 5c 63 20  acter.**     \c 
0550: 20 20 20 20 20 43 68 61 72 61 63 74 65 72 20 63       Character c
0560: 20 77 68 65 72 65 20 63 20 69 73 20 6f 6e 65 20   where c is one 
0570: 6f 66 20 5c 7b 7d 28 29 5b 5d 7c 2a 2b 3f 2e 0a  of \{}()[]|*+?..
0580: 2a 2a 20 20 20 20 20 5c 63 20 20 20 20 20 20 43  **     \c      C
0590: 2d 6c 61 6e 67 75 61 67 65 20 65 73 63 61 70 65  -language escape
05a0: 73 20 66 6f 72 20 63 20 69 6e 20 61 66 6e 72 74  s for c in afnrt
05b0: 76 2e 20 20 65 78 3a 20 5c 74 20 6f 72 20 5c 6e  v.  ex: \t or \n
05c0: 0a 2a 2a 20 20 20 20 20 5c 75 58 58 58 58 20 20  .**     \uXXXX  
05d0: 57 68 65 72 65 20 58 58 58 58 20 69 73 20 65 78  Where XXXX is ex
05e0: 61 63 74 6c 79 20 34 20 68 65 78 20 64 69 67 69  actly 4 hex digi
05f0: 74 73 2c 20 75 6e 69 63 6f 64 65 20 76 61 6c 75  ts, unicode valu
0600: 65 20 58 58 58 58 0a 2a 2a 20 20 20 20 20 5c 78  e XXXX.**     \x
0610: 58 58 20 20 20 20 57 68 65 72 65 20 58 58 20 69  XX    Where XX i
0620: 73 20 65 78 61 63 74 6c 79 20 32 20 68 65 78 20  s exactly 2 hex 
0630: 64 69 67 69 74 73 2c 20 75 6e 69 63 6f 64 65 20  digits, unicode 
0640: 76 61 6c 75 65 20 58 58 0a 2a 2a 20 20 20 20 20  value XX.**     
0650: 5b 61 62 63 5d 20 20 20 41 6e 79 20 73 69 6e 67  [abc]   Any sing
0660: 6c 65 20 63 68 61 72 61 63 74 65 72 20 66 72 6f  le character fro
0670: 6d 20 74 68 65 20 73 65 74 20 61 62 63 0a 2a 2a  m the set abc.**
0680: 20 20 20 20 20 5b 5e 61 62 63 5d 20 20 41 6e 79       [^abc]  Any
0690: 20 73 69 6e 67 6c 65 20 63 68 61 72 61 63 74 65   single characte
06a0: 72 20 6e 6f 74 20 69 6e 20 74 68 65 20 73 65 74  r not in the set
06b0: 20 61 62 63 0a 2a 2a 20 20 20 20 20 5b 61 2d 7a   abc.**     [a-z
06c0: 5d 20 20 20 41 6e 79 20 73 69 6e 67 6c 65 20 63  ]   Any single c
06d0: 68 61 72 61 63 74 65 72 20 69 6e 20 74 68 65 20  haracter in the 
06e0: 72 61 6e 67 65 20 61 2d 7a 0a 2a 2a 20 20 20 20  range a-z.**    
06f0: 20 5b 5e 61 2d 7a 5d 20 20 41 6e 79 20 73 69 6e   [^a-z]  Any sin
0700: 67 6c 65 20 63 68 61 72 61 63 74 65 72 20 6e 6f  gle character no
0710: 74 20 69 6e 20 74 68 65 20 72 61 6e 67 65 20 61  t in the range a
0720: 2d 7a 0a 2a 2a 20 20 20 20 20 5c 62 20 20 20 20  -z.**     \b    
0730: 20 20 57 6f 72 64 20 62 6f 75 6e 64 61 72 79 0a    Word boundary.
0740: 2a 2a 20 20 20 20 20 5c 77 20 20 20 20 20 20 57  **     \w      W
0750: 6f 72 64 20 63 68 61 72 61 63 74 65 72 2e 20 20  ord character.  
0760: 5b 41 2d 5a 61 2d 7a 30 2d 39 5f 5d 0a 2a 2a 20  [A-Za-z0-9_].** 
0770: 20 20 20 20 5c 57 20 20 20 20 20 20 4e 6f 6e 2d      \W      Non-
0780: 77 6f 72 64 20 63 68 61 72 61 63 74 65 72 0a 2a  word character.*
0790: 2a 20 20 20 20 20 5c 64 20 20 20 20 20 20 44 69  *     \d      Di
07a0: 67 69 74 0a 2a 2a 20 20 20 20 20 5c 44 20 20 20  git.**     \D   
07b0: 20 20 20 4e 6f 6e 2d 64 69 67 69 74 0a 2a 2a 20     Non-digit.** 
07c0: 20 20 20 20 5c 73 20 20 20 20 20 20 57 68 69 74      \s      Whit
07d0: 65 73 70 61 63 65 20 63 68 61 72 61 63 74 65 72  espace character
07e0: 0a 2a 2a 20 20 20 20 20 5c 53 20 20 20 20 20 20  .**     \S      
07f0: 4e 6f 6e 2d 77 68 69 74 65 73 70 61 63 65 20 63  Non-whitespace c
0800: 68 61 72 61 63 74 65 72 0a 2a 2a 0a 2a 2a 20 41  haracter.**.** A
0810: 20 6e 6f 6e 64 65 74 65 72 6d 69 6e 69 73 74 69   nondeterministi
0820: 63 20 66 69 6e 69 74 65 20 61 75 74 6f 6d 61 74  c finite automat
0830: 6f 6e 20 28 4e 46 41 29 20 69 73 20 75 73 65 64  on (NFA) is used
0840: 20 66 6f 72 20 6d 61 74 63 68 69 6e 67 2c 20 73   for matching, s
0850: 6f 20 74 68 65 0a 2a 2a 20 70 65 72 66 6f 72 6d  o the.** perform
0860: 61 6e 63 65 20 69 73 20 62 6f 75 6e 64 65 64 20  ance is bounded 
0870: 62 79 20 4f 28 4e 2a 4d 29 20 77 68 65 72 65 20  by O(N*M) where 
0880: 4e 20 69 73 20 74 68 65 20 73 69 7a 65 20 6f 66  N is the size of
0890: 20 74 68 65 20 72 65 67 75 6c 61 72 0a 2a 2a 20   the regular.** 
08a0: 65 78 70 72 65 73 73 69 6f 6e 20 61 6e 64 20 4d  expression and M
08b0: 20 69 73 20 74 68 65 20 73 69 7a 65 20 6f 66 20   is the size of 
08c0: 74 68 65 20 69 6e 70 75 74 20 73 74 72 69 6e 67  the input string
08d0: 2e 20 20 54 68 65 20 6d 61 74 63 68 65 72 20 6e  .  The matcher n
08e0: 65 76 65 72 0a 2a 2a 20 65 78 68 69 62 69 74 73  ever.** exhibits
08f0: 20 65 78 70 6f 6e 65 6e 74 69 61 6c 20 62 65 68   exponential beh
0900: 61 76 69 6f 72 2e 20 20 4e 6f 74 65 20 74 68 61  avior.  Note tha
0910: 74 20 74 68 65 20 58 7b 70 2c 71 7d 20 6f 70 65  t the X{p,q} ope
0920: 72 61 74 6f 72 20 65 78 70 61 6e 64 73 0a 2a 2a  rator expands.**
0930: 20 74 6f 20 70 20 63 6f 70 69 65 73 20 6f 66 20   to p copies of 
0940: 58 20 66 6f 6c 6c 6f 77 69 6e 67 20 62 79 20 71  X following by q
0950: 2d 70 20 63 6f 70 69 65 73 20 6f 66 20 58 3f 20  -p copies of X? 
0960: 61 6e 64 20 74 68 61 74 20 74 68 65 20 73 69 7a  and that the siz
0970: 65 20 6f 66 20 74 68 65 0a 2a 2a 20 72 65 67 75  e of the.** regu
0980: 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20 69  lar expression i
0990: 6e 20 74 68 65 20 4f 28 4e 2a 4d 29 20 70 65 72  n the O(N*M) per
09a0: 66 6f 72 6d 61 6e 63 65 20 62 6f 75 6e 64 20 69  formance bound i
09b0: 73 20 63 6f 6d 70 75 74 65 64 20 61 66 74 65 72  s computed after
09c0: 0a 2a 2a 20 74 68 69 73 20 65 78 70 61 6e 73 69  .** this expansi
09d0: 6f 6e 2e 0a 2a 2f 0a 23 69 6e 63 6c 75 64 65 20  on..*/.#include 
09e0: 3c 73 74 72 69 6e 67 2e 68 3e 0a 23 69 6e 63 6c  <string.h>.#incl
09f0: 75 64 65 20 3c 73 74 64 6c 69 62 2e 68 3e 0a 23  ude <stdlib.h>.#
0a00: 69 6e 63 6c 75 64 65 20 22 73 71 6c 69 74 65 33  include "sqlite3
0a10: 65 78 74 2e 68 22 0a 53 51 4c 49 54 45 5f 45 58  ext.h".SQLITE_EX
0a20: 54 45 4e 53 49 4f 4e 5f 49 4e 49 54 31 0a 0a 2f  TENSION_INIT1../
0a30: 2a 0a 2a 2a 20 54 68 65 20 66 6f 6c 6c 6f 77 69  *.** The followi
0a40: 6e 67 20 23 64 65 66 69 6e 65 73 20 63 68 61 6e  ng #defines chan
0a50: 67 65 20 74 68 65 20 6e 61 6d 65 73 20 6f 66 20  ge the names of 
0a60: 73 6f 6d 65 20 66 75 6e 63 74 69 6f 6e 73 20 69  some functions i
0a70: 6d 70 6c 65 6d 65 6e 74 65 64 20 69 6e 0a 2a 2a  mplemented in.**
0a80: 20 74 68 69 73 20 66 69 6c 65 20 74 6f 20 70 72   this file to pr
0a90: 65 76 65 6e 74 20 6e 61 6d 65 20 63 6f 6c 6c 69  event name colli
0aa0: 73 69 6f 6e 73 20 77 69 74 68 20 43 2d 6c 69 62  sions with C-lib
0ab0: 72 61 72 79 20 66 75 6e 63 74 69 6f 6e 73 20 6f  rary functions o
0ac0: 66 20 74 68 65 0a 2a 2a 20 73 61 6d 65 20 6e 61  f the.** same na
0ad0: 6d 65 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 72  me..*/.#define r
0ae0: 65 5f 6d 61 74 63 68 20 20 20 73 71 6c 69 74 65  e_match   sqlite
0af0: 33 72 65 5f 6d 61 74 63 68 0a 23 64 65 66 69 6e  3re_match.#defin
0b00: 65 20 72 65 5f 63 6f 6d 70 69 6c 65 20 73 71 6c  e re_compile sql
0b10: 69 74 65 33 72 65 5f 63 6f 6d 70 69 6c 65 0a 23  ite3re_compile.#
0b20: 64 65 66 69 6e 65 20 72 65 5f 66 72 65 65 20 20  define re_free  
0b30: 20 20 73 71 6c 69 74 65 33 72 65 5f 66 72 65 65    sqlite3re_free
0b40: 0a 0a 2f 2a 20 54 68 65 20 65 6e 64 2d 6f 66 2d  ../* The end-of-
0b50: 69 6e 70 75 74 20 63 68 61 72 61 63 74 65 72 20  input character 
0b60: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 45 4f  */.#define RE_EO
0b70: 46 20 20 20 20 20 20 20 20 20 20 20 20 30 20 20  F            0  
0b80: 20 20 2f 2a 20 45 6e 64 20 6f 66 20 69 6e 70 75    /* End of inpu
0b90: 74 20 2a 2f 0a 0a 2f 2a 20 54 68 65 20 4e 46 41  t */../* The NFA
0ba0: 20 69 73 20 69 6d 70 6c 65 6d 65 6e 74 65 64 20   is implemented 
0bb0: 61 73 20 73 65 71 75 65 6e 63 65 20 6f 66 20 6f  as sequence of o
0bc0: 70 63 6f 64 65 73 20 74 61 6b 65 6e 20 66 72 6f  pcodes taken fro
0bd0: 6d 20 74 68 65 20 66 6f 6c 6c 6f 77 69 6e 67 0a  m the following.
0be0: 2a 2a 20 73 65 74 2e 20 20 45 61 63 68 20 6f 70  ** set.  Each op
0bf0: 63 6f 64 65 20 68 61 73 20 61 20 73 69 6e 67 6c  code has a singl
0c00: 65 20 69 6e 74 65 67 65 72 20 61 72 67 75 6d 65  e integer argume
0c10: 6e 74 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 52  nt..*/.#define R
0c20: 45 5f 4f 50 5f 4d 41 54 43 48 20 20 20 20 20 20  E_OP_MATCH      
0c30: 20 31 20 20 20 20 2f 2a 20 4d 61 74 63 68 20 74   1    /* Match t
0c40: 68 65 20 6f 6e 65 20 63 68 61 72 61 63 74 65 72  he one character
0c50: 20 69 6e 20 74 68 65 20 61 72 67 75 6d 65 6e 74   in the argument
0c60: 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f   */.#define RE_O
0c70: 50 5f 41 4e 59 20 20 20 20 20 20 20 20 20 32 20  P_ANY         2 
0c80: 20 20 20 2f 2a 20 4d 61 74 63 68 20 61 6e 79 20     /* Match any 
0c90: 6f 6e 65 20 63 68 61 72 61 63 74 65 72 2e 20 20  one character.  
0ca0: 28 49 6d 70 6c 65 6d 65 6e 74 73 20 22 2e 22 29  (Implements ".")
0cb0: 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f   */.#define RE_O
0cc0: 50 5f 41 4e 59 53 54 41 52 20 20 20 20 20 33 20  P_ANYSTAR     3 
0cd0: 20 20 20 2f 2a 20 53 70 65 63 69 61 6c 20 6f 70     /* Special op
0ce0: 74 69 6d 69 7a 65 64 20 76 65 72 73 69 6f 6e 20  timized version 
0cf0: 6f 66 20 2e 2a 20 2a 2f 0a 23 64 65 66 69 6e 65  of .* */.#define
0d00: 20 52 45 5f 4f 50 5f 46 4f 52 4b 20 20 20 20 20   RE_OP_FORK     
0d10: 20 20 20 34 20 20 20 20 2f 2a 20 43 6f 6e 74 69     4    /* Conti
0d20: 6e 75 65 20 74 6f 20 62 6f 74 68 20 6e 65 78 74  nue to both next
0d30: 20 61 6e 64 20 6f 70 63 6f 64 65 20 61 74 20 69   and opcode at i
0d40: 41 72 67 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  Arg */.#define R
0d50: 45 5f 4f 50 5f 47 4f 54 4f 20 20 20 20 20 20 20  E_OP_GOTO       
0d60: 20 35 20 20 20 20 2f 2a 20 4a 75 6d 70 20 74 6f   5    /* Jump to
0d70: 20 6f 70 63 6f 64 65 20 61 74 20 69 41 72 67 20   opcode at iArg 
0d80: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50  */.#define RE_OP
0d90: 5f 41 43 43 45 50 54 20 20 20 20 20 20 36 20 20  _ACCEPT      6  
0da0: 20 20 2f 2a 20 48 61 6c 74 20 61 6e 64 20 69 6e    /* Halt and in
0db0: 64 69 63 61 74 65 20 61 20 73 75 63 63 65 73 73  dicate a success
0dc0: 66 75 6c 20 6d 61 74 63 68 20 2a 2f 0a 23 64 65  ful match */.#de
0dd0: 66 69 6e 65 20 52 45 5f 4f 50 5f 43 43 5f 49 4e  fine RE_OP_CC_IN
0de0: 43 20 20 20 20 20 20 37 20 20 20 20 2f 2a 20 42  C      7    /* B
0df0: 65 67 69 6e 6e 69 6e 67 20 6f 66 20 61 20 5b 2e  eginning of a [.
0e00: 2e 2e 5d 20 63 68 61 72 61 63 74 65 72 20 63 6c  ..] character cl
0e10: 61 73 73 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  ass */.#define R
0e20: 45 5f 4f 50 5f 43 43 5f 45 58 43 20 20 20 20 20  E_OP_CC_EXC     
0e30: 20 38 20 20 20 20 2f 2a 20 42 65 67 69 6e 6e 69   8    /* Beginni
0e40: 6e 67 20 6f 66 20 61 20 5b 5e 2e 2e 2e 5d 20 63  ng of a [^...] c
0e50: 68 61 72 61 63 74 65 72 20 63 6c 61 73 73 20 2a  haracter class *
0e60: 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f  /.#define RE_OP_
0e70: 43 43 5f 56 41 4c 55 45 20 20 20 20 39 20 20 20  CC_VALUE    9   
0e80: 20 2f 2a 20 53 69 6e 67 6c 65 20 76 61 6c 75 65   /* Single value
0e90: 20 69 6e 20 61 20 63 68 61 72 61 63 74 65 72 20   in a character 
0ea0: 63 6c 61 73 73 20 2a 2f 0a 23 64 65 66 69 6e 65  class */.#define
0eb0: 20 52 45 5f 4f 50 5f 43 43 5f 52 41 4e 47 45 20   RE_OP_CC_RANGE 
0ec0: 20 20 31 30 20 20 20 20 2f 2a 20 52 61 6e 67 65    10    /* Range
0ed0: 20 6f 66 20 76 61 6c 75 65 73 20 69 6e 20 61 20   of values in a 
0ee0: 63 68 61 72 61 63 74 65 72 20 63 6c 61 73 73 20  character class 
0ef0: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50  */.#define RE_OP
0f00: 5f 57 4f 52 44 20 20 20 20 20 20 20 31 31 20 20  _WORD       11  
0f10: 20 20 2f 2a 20 50 65 72 6c 20 77 6f 72 64 20 63    /* Perl word c
0f20: 68 61 72 61 63 74 65 72 20 5b 41 2d 5a 61 2d 7a  haracter [A-Za-z
0f30: 30 2d 39 5f 5d 20 2a 2f 0a 23 64 65 66 69 6e 65  0-9_] */.#define
0f40: 20 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 20 20   RE_OP_NOTWORD  
0f50: 20 20 31 32 20 20 20 20 2f 2a 20 4e 6f 74 20 61    12    /* Not a
0f60: 20 70 65 72 6c 20 77 6f 72 64 20 63 68 61 72 61   perl word chara
0f70: 63 74 65 72 20 2a 2f 0a 23 64 65 66 69 6e 65 20  cter */.#define 
0f80: 52 45 5f 4f 50 5f 44 49 47 49 54 20 20 20 20 20  RE_OP_DIGIT     
0f90: 20 31 33 20 20 20 20 2f 2a 20 64 69 67 69 74 3a   13    /* digit:
0fa0: 20 20 5b 30 2d 39 5d 20 2a 2f 0a 23 64 65 66 69    [0-9] */.#defi
0fb0: 6e 65 20 52 45 5f 4f 50 5f 4e 4f 54 44 49 47 49  ne RE_OP_NOTDIGI
0fc0: 54 20 20 20 31 34 20 20 20 20 2f 2a 20 4e 6f 74  T   14    /* Not
0fd0: 20 61 20 64 69 67 69 74 20 2a 2f 0a 23 64 65 66   a digit */.#def
0fe0: 69 6e 65 20 52 45 5f 4f 50 5f 53 50 41 43 45 20  ine RE_OP_SPACE 
0ff0: 20 20 20 20 20 31 35 20 20 20 20 2f 2a 20 73 70       15    /* sp
1000: 61 63 65 3a 20 20 5b 20 5c 74 5c 6e 5c 72 5c 76  ace:  [ \t\n\r\v
1010: 5c 66 5d 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  \f] */.#define R
1020: 45 5f 4f 50 5f 4e 4f 54 53 50 41 43 45 20 20 20  E_OP_NOTSPACE   
1030: 31 36 20 20 20 20 2f 2a 20 4e 6f 74 20 61 20 64  16    /* Not a d
1040: 69 67 69 74 20 2a 2f 0a 23 64 65 66 69 6e 65 20  igit */.#define 
1050: 52 45 5f 4f 50 5f 42 4f 55 4e 44 41 52 59 20 20  RE_OP_BOUNDARY  
1060: 20 31 37 20 20 20 20 2f 2a 20 42 6f 75 6e 64 61   17    /* Bounda
1070: 72 79 20 62 65 74 77 65 65 6e 20 77 6f 72 64 20  ry between word 
1080: 61 6e 64 20 6e 6f 6e 2d 77 6f 72 64 20 2a 2f 0a  and non-word */.
1090: 0a 2f 2a 20 45 61 63 68 20 6f 70 63 6f 64 65 20  ./* Each opcode 
10a0: 69 73 20 61 20 22 73 74 61 74 65 22 20 69 6e 20  is a "state" in 
10b0: 74 68 65 20 4e 46 41 20 2a 2f 0a 74 79 70 65 64  the NFA */.typed
10c0: 65 66 20 75 6e 73 69 67 6e 65 64 20 73 68 6f 72  ef unsigned shor
10d0: 74 20 52 65 53 74 61 74 65 4e 75 6d 62 65 72 3b  t ReStateNumber;
10e0: 0a 0a 2f 2a 20 42 65 63 61 75 73 65 20 74 68 69  ../* Because thi
10f0: 73 20 69 73 20 61 6e 20 4e 46 41 20 61 6e 64 20  s is an NFA and 
1100: 6e 6f 74 20 61 20 44 46 41 2c 20 6d 75 6c 74 69  not a DFA, multi
1110: 70 6c 65 20 73 74 61 74 65 73 20 63 61 6e 20 62  ple states can b
1120: 65 20 61 63 74 69 76 65 20 61 74 0a 2a 2a 20 6f  e active at.** o
1130: 6e 63 65 2e 20 20 41 6e 20 69 6e 73 74 61 6e 63  nce.  An instanc
1140: 65 20 6f 66 20 74 68 65 20 66 6f 6c 6c 6f 77 69  e of the followi
1150: 6e 67 20 6f 62 6a 65 63 74 20 72 65 63 6f 72 64  ng object record
1160: 73 20 61 6c 6c 20 61 63 74 69 76 65 20 73 74 61  s all active sta
1170: 74 65 73 20 69 6e 0a 2a 2a 20 74 68 65 20 4e 46  tes in.** the NF
1180: 41 2e 20 20 54 68 65 20 69 6d 70 6c 65 6d 65 6e  A.  The implemen
1190: 74 61 74 69 6f 6e 20 69 73 20 6f 70 74 69 6d 69  tation is optimi
11a0: 7a 65 64 20 66 6f 72 20 74 68 65 20 63 6f 6d 6d  zed for the comm
11b0: 6f 6e 20 63 61 73 65 20 77 68 65 72 65 20 74 68  on case where th
11c0: 65 0a 2a 2a 20 6e 75 6d 62 65 72 20 6f 66 20 61  e.** number of a
11d0: 63 74 69 76 65 73 20 73 74 61 74 65 73 20 69 73  ctives states is
11e0: 20 73 6d 61 6c 6c 2e 0a 2a 2f 0a 74 79 70 65 64   small..*/.typed
11f0: 65 66 20 73 74 72 75 63 74 20 52 65 53 74 61 74  ef struct ReStat
1200: 65 53 65 74 20 7b 0a 20 20 75 6e 73 69 67 6e 65  eSet {.  unsigne
1210: 64 20 6e 53 74 61 74 65 3b 20 20 20 20 20 20 20  d nState;       
1220: 20 20 20 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f       /* Number o
1230: 66 20 63 75 72 72 65 6e 74 20 73 74 61 74 65 73  f current states
1240: 20 2a 2f 0a 20 20 52 65 53 74 61 74 65 4e 75 6d   */.  ReStateNum
1250: 62 65 72 20 2a 61 53 74 61 74 65 3b 20 20 20 20  ber *aState;    
1260: 20 20 2f 2a 20 43 75 72 72 65 6e 74 20 73 74 61    /* Current sta
1270: 74 65 73 20 2a 2f 0a 7d 20 52 65 53 74 61 74 65  tes */.} ReState
1280: 53 65 74 3b 0a 0a 2f 2a 20 41 6e 20 69 6e 70 75  Set;../* An inpu
1290: 74 20 73 74 72 69 6e 67 20 72 65 61 64 20 6f 6e  t string read on
12a0: 65 20 63 68 61 72 61 63 74 65 72 20 61 74 20 61  e character at a
12b0: 20 74 69 6d 65 2e 0a 2a 2f 0a 74 79 70 65 64 65   time..*/.typede
12c0: 66 20 73 74 72 75 63 74 20 52 65 49 6e 70 75 74  f struct ReInput
12d0: 20 52 65 49 6e 70 75 74 3b 0a 73 74 72 75 63 74   ReInput;.struct
12e0: 20 52 65 49 6e 70 75 74 20 7b 0a 20 20 63 6f 6e   ReInput {.  con
12f0: 73 74 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72  st unsigned char
1300: 20 2a 7a 3b 20 20 2f 2a 20 41 6c 6c 20 74 65 78   *z;  /* All tex
1310: 74 20 2a 2f 0a 20 20 69 6e 74 20 69 3b 20 20 20  t */.  int i;   
1320: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1330: 2f 2a 20 4e 65 78 74 20 62 79 74 65 20 74 6f 20  /* Next byte to 
1340: 72 65 61 64 20 2a 2f 0a 20 20 69 6e 74 20 6d 78  read */.  int mx
1350: 3b 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ;               
1360: 20 20 20 2f 2a 20 45 4f 46 20 77 68 65 6e 20 69     /* EOF when i
1370: 3e 3d 6d 78 20 2a 2f 0a 7d 3b 0a 0a 2f 2a 20 41  >=mx */.};../* A
1380: 20 63 6f 6d 70 69 6c 65 64 20 4e 46 41 20 28 6f   compiled NFA (o
1390: 72 20 61 6e 20 4e 46 41 20 74 68 61 74 20 69 73  r an NFA that is
13a0: 20 69 6e 20 74 68 65 20 70 72 6f 63 65 73 73 20   in the process 
13b0: 6f 66 20 62 65 69 6e 67 20 63 6f 6d 70 69 6c 65  of being compile
13c0: 64 29 20 69 73 0a 2a 2a 20 61 6e 20 69 6e 73 74  d) is.** an inst
13d0: 61 6e 63 65 20 6f 66 20 74 68 65 20 66 6f 6c 6c  ance of the foll
13e0: 6f 77 69 6e 67 20 6f 62 6a 65 63 74 2e 0a 2a 2f  owing object..*/
13f0: 0a 74 79 70 65 64 65 66 20 73 74 72 75 63 74 20  .typedef struct 
1400: 52 65 43 6f 6d 70 69 6c 65 64 20 52 65 43 6f 6d  ReCompiled ReCom
1410: 70 69 6c 65 64 3b 0a 73 74 72 75 63 74 20 52 65  piled;.struct Re
1420: 43 6f 6d 70 69 6c 65 64 20 7b 0a 20 20 52 65 49  Compiled {.  ReI
1430: 6e 70 75 74 20 73 49 6e 3b 20 20 20 20 20 20 20  nput sIn;       
1440: 20 20 20 20 20 20 20 20 20 2f 2a 20 52 65 67 75           /* Regu
1450: 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20 74  lar expression t
1460: 65 78 74 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63  ext */.  const c
1470: 68 61 72 20 2a 7a 45 72 72 3b 20 20 20 20 20 20  har *zErr;      
1480: 20 20 20 20 20 2f 2a 20 45 72 72 6f 72 20 6d 65       /* Error me
1490: 73 73 61 67 65 20 74 6f 20 72 65 74 75 72 6e 20  ssage to return 
14a0: 2a 2f 0a 20 20 63 68 61 72 20 2a 61 4f 70 3b 20  */.  char *aOp; 
14b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
14c0: 20 2f 2a 20 4f 70 65 72 61 74 6f 72 73 20 66 6f   /* Operators fo
14d0: 72 20 74 68 65 20 76 69 72 74 75 61 6c 20 6d 61  r the virtual ma
14e0: 63 68 69 6e 65 20 2a 2f 0a 20 20 69 6e 74 20 2a  chine */.  int *
14f0: 61 41 72 67 3b 20 20 20 20 20 20 20 20 20 20 20  aArg;           
1500: 20 20 20 20 20 20 20 2f 2a 20 41 72 67 75 6d 65         /* Argume
1510: 6e 74 73 20 74 6f 20 65 61 63 68 20 6f 70 65 72  nts to each oper
1520: 61 74 6f 72 20 2a 2f 0a 20 20 75 6e 73 69 67 6e  ator */.  unsign
1530: 65 64 20 28 2a 78 4e 65 78 74 43 68 61 72 29 28  ed (*xNextChar)(
1540: 52 65 49 6e 70 75 74 2a 29 3b 20 20 2f 2a 20 4e  ReInput*);  /* N
1550: 65 78 74 20 63 68 61 72 61 63 74 65 72 20 66 75  ext character fu
1560: 6e 63 74 69 6f 6e 20 2a 2f 0a 20 20 75 6e 73 69  nction */.  unsi
1570: 67 6e 65 64 20 63 68 61 72 20 7a 49 6e 69 74 5b  gned char zInit[
1580: 31 32 5d 3b 20 20 20 20 2f 2a 20 49 6e 69 74 69  12];    /* Initi
1590: 61 6c 20 74 65 78 74 20 74 6f 20 6d 61 74 63 68  al text to match
15a0: 20 2a 2f 0a 20 20 69 6e 74 20 6e 49 6e 69 74 3b   */.  int nInit;
15b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
15c0: 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f 66 20 63    /* Number of c
15d0: 68 61 72 61 63 74 65 72 73 20 69 6e 20 7a 49 6e  haracters in zIn
15e0: 69 74 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64  it */.  unsigned
15f0: 20 6e 53 74 61 74 65 3b 20 20 20 20 20 20 20 20   nState;        
1600: 20 20 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f 66      /* Number of
1610: 20 65 6e 74 72 69 65 73 20 69 6e 20 61 4f 70 5b   entries in aOp[
1620: 5d 20 61 6e 64 20 61 41 72 67 5b 5d 20 2a 2f 0a  ] and aArg[] */.
1630: 20 20 75 6e 73 69 67 6e 65 64 20 6e 41 6c 6c 6f    unsigned nAllo
1640: 63 3b 20 20 20 20 20 20 20 20 20 20 20 20 2f 2a  c;            /*
1650: 20 53 6c 6f 74 73 20 61 6c 6c 6f 63 61 74 65 64   Slots allocated
1660: 20 66 6f 72 20 61 4f 70 5b 5d 20 61 6e 64 20 61   for aOp[] and a
1670: 41 72 67 5b 5d 20 2a 2f 0a 7d 3b 0a 0a 2f 2a 20  Arg[] */.};../* 
1680: 41 64 64 20 61 20 73 74 61 74 65 20 74 6f 20 74  Add a state to t
1690: 68 65 20 67 69 76 65 6e 20 73 74 61 74 65 20 73  he given state s
16a0: 65 74 20 69 66 20 69 74 20 69 73 20 6e 6f 74 20  et if it is not 
16b0: 61 6c 72 65 61 64 79 20 74 68 65 72 65 20 2a 2f  already there */
16c0: 0a 73 74 61 74 69 63 20 76 6f 69 64 20 72 65 5f  .static void re_
16d0: 61 64 64 5f 73 74 61 74 65 28 52 65 53 74 61 74  add_state(ReStat
16e0: 65 53 65 74 20 2a 70 53 65 74 2c 20 69 6e 74 20  eSet *pSet, int 
16f0: 6e 65 77 53 74 61 74 65 29 7b 0a 20 20 75 6e 73  newState){.  uns
1700: 69 67 6e 65 64 20 69 3b 0a 20 20 66 6f 72 28 69  igned i;.  for(i
1710: 3d 30 3b 20 69 3c 70 53 65 74 2d 3e 6e 53 74 61  =0; i<pSet->nSta
1720: 74 65 3b 20 69 2b 2b 29 20 69 66 28 20 70 53 65  te; i++) if( pSe
1730: 74 2d 3e 61 53 74 61 74 65 5b 69 5d 3d 3d 6e 65  t->aState[i]==ne
1740: 77 53 74 61 74 65 20 29 20 72 65 74 75 72 6e 3b  wState ) return;
1750: 0a 20 20 70 53 65 74 2d 3e 61 53 74 61 74 65 5b  .  pSet->aState[
1760: 70 53 65 74 2d 3e 6e 53 74 61 74 65 2b 2b 5d 20  pSet->nState++] 
1770: 3d 20 28 52 65 53 74 61 74 65 4e 75 6d 62 65 72  = (ReStateNumber
1780: 29 6e 65 77 53 74 61 74 65 3b 0a 7d 0a 0a 2f 2a  )newState;.}../*
1790: 20 45 78 74 72 61 63 74 20 74 68 65 20 6e 65 78   Extract the nex
17a0: 74 20 75 6e 69 63 6f 64 65 20 63 68 61 72 61 63  t unicode charac
17b0: 74 65 72 20 66 72 6f 6d 20 2a 70 7a 49 6e 20 61  ter from *pzIn a
17c0: 6e 64 20 72 65 74 75 72 6e 20 69 74 2e 20 20 41  nd return it.  A
17d0: 64 76 61 6e 63 65 0a 2a 2a 20 2a 70 7a 49 6e 20  dvance.** *pzIn 
17e0: 74 6f 20 74 68 65 20 66 69 72 73 74 20 62 79 74  to the first byt
17f0: 65 20 70 61 73 74 20 74 68 65 20 65 6e 64 20 6f  e past the end o
1800: 66 20 74 68 65 20 63 68 61 72 61 63 74 65 72 20  f the character 
1810: 72 65 74 75 72 6e 65 64 2e 20 20 54 6f 0a 2a 2a  returned.  To.**
1820: 20 62 65 20 63 6c 65 61 72 3a 20 20 74 68 69 73   be clear:  this
1830: 20 72 6f 75 74 69 6e 65 20 63 6f 6e 76 65 72 74   routine convert
1840: 73 20 75 74 66 38 20 74 6f 20 75 6e 69 63 6f 64  s utf8 to unicod
1850: 65 2e 20 20 54 68 69 73 20 72 6f 75 74 69 6e 65  e.  This routine
1860: 20 69 73 20 0a 2a 2a 20 6f 70 74 69 6d 69 7a 65   is .** optimize
1870: 64 20 66 6f 72 20 74 68 65 20 63 6f 6d 6d 6f 6e  d for the common
1880: 20 63 61 73 65 20 77 68 65 72 65 20 74 68 65 20   case where the 
1890: 6e 65 78 74 20 63 68 61 72 61 63 74 65 72 20 69  next character i
18a0: 73 20 61 20 73 69 6e 67 6c 65 20 62 79 74 65 2e  s a single byte.
18b0: 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e 73 69 67  .*/.static unsig
18c0: 6e 65 64 20 72 65 5f 6e 65 78 74 5f 63 68 61 72  ned re_next_char
18d0: 28 52 65 49 6e 70 75 74 20 2a 70 29 7b 0a 20 20  (ReInput *p){.  
18e0: 75 6e 73 69 67 6e 65 64 20 63 3b 0a 20 20 69 66  unsigned c;.  if
18f0: 28 20 70 2d 3e 69 3e 3d 70 2d 3e 6d 78 20 29 20  ( p->i>=p->mx ) 
1900: 72 65 74 75 72 6e 20 30 3b 0a 20 20 63 20 3d 20  return 0;.  c = 
1910: 70 2d 3e 7a 5b 70 2d 3e 69 2b 2b 5d 3b 0a 20 20  p->z[p->i++];.  
1920: 69 66 28 20 63 3e 3d 30 78 38 30 20 29 7b 0a 20  if( c>=0x80 ){. 
1930: 20 20 20 69 66 28 20 28 63 26 30 78 65 30 29 3d     if( (c&0xe0)=
1940: 3d 30 78 63 30 20 26 26 20 70 2d 3e 69 3c 70 2d  =0xc0 && p->i<p-
1950: 3e 6d 78 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e  >mx && (p->z[p->
1960: 69 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 20 29  i]&0xc0)==0x80 )
1970: 7b 0a 20 20 20 20 20 20 63 20 3d 20 28 63 26 30  {.      c = (c&0
1980: 78 31 66 29 3c 3c 36 20 7c 20 28 70 2d 3e 7a 5b  x1f)<<6 | (p->z[
1990: 70 2d 3e 69 2b 2b 5d 26 30 78 33 66 29 3b 0a 20  p->i++]&0x3f);. 
19a0: 20 20 20 20 20 69 66 28 20 63 3c 30 78 38 30 20       if( c<0x80 
19b0: 29 20 63 20 3d 20 30 78 66 66 66 64 3b 0a 20 20  ) c = 0xfffd;.  
19c0: 20 20 7d 65 6c 73 65 20 69 66 28 20 28 63 26 30    }else if( (c&0
19d0: 78 66 30 29 3d 3d 30 78 65 30 20 26 26 20 70 2d  xf0)==0xe0 && p-
19e0: 3e 69 2b 31 3c 70 2d 3e 6d 78 20 26 26 20 28 70  >i+1<p->mx && (p
19f0: 2d 3e 7a 5b 70 2d 3e 69 5d 26 30 78 63 30 29 3d  ->z[p->i]&0xc0)=
1a00: 3d 30 78 38 30 0a 20 20 20 20 20 20 20 20 20 20  =0x80.          
1a10: 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 31   && (p->z[p->i+1
1a20: 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 20 29 7b  ]&0xc0)==0x80 ){
1a30: 0a 20 20 20 20 20 20 63 20 3d 20 28 63 26 30 78  .      c = (c&0x
1a40: 30 66 29 3c 3c 31 32 20 7c 20 28 28 70 2d 3e 7a  0f)<<12 | ((p->z
1a50: 5b 70 2d 3e 69 5d 26 30 78 33 66 29 3c 3c 36 29  [p->i]&0x3f)<<6)
1a60: 20 7c 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 31 5d   | (p->z[p->i+1]
1a70: 26 30 78 33 66 29 3b 0a 20 20 20 20 20 20 70 2d  &0x3f);.      p-
1a80: 3e 69 20 2b 3d 20 32 3b 0a 20 20 20 20 20 20 69  >i += 2;.      i
1a90: 66 28 20 63 3c 3d 30 78 33 66 66 20 7c 7c 20 28  f( c<=0x3ff || (
1aa0: 63 3e 3d 30 78 64 38 30 30 20 26 26 20 63 3c 3d  c>=0xd800 && c<=
1ab0: 30 78 64 66 66 66 29 20 29 20 63 20 3d 20 30 78  0xdfff) ) c = 0x
1ac0: 66 66 66 64 3b 0a 20 20 20 20 7d 65 6c 73 65 20  fffd;.    }else 
1ad0: 69 66 28 20 28 63 26 30 78 66 38 29 3d 3d 30 78  if( (c&0xf8)==0x
1ae0: 66 30 20 26 26 20 70 2d 3e 69 2b 33 3c 70 2d 3e  f0 && p->i+3<p->
1af0: 6d 78 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69  mx && (p->z[p->i
1b00: 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 0a 20 20  ]&0xc0)==0x80.  
1b10: 20 20 20 20 20 20 20 20 20 26 26 20 28 70 2d 3e           && (p->
1b20: 7a 5b 70 2d 3e 69 2b 31 5d 26 30 78 63 30 29 3d  z[p->i+1]&0xc0)=
1b30: 3d 30 78 38 30 20 26 26 20 28 70 2d 3e 7a 5b 70  =0x80 && (p->z[p
1b40: 2d 3e 69 2b 32 5d 26 30 78 63 30 29 3d 3d 30 78  ->i+2]&0xc0)==0x
1b50: 38 30 20 29 7b 0a 20 20 20 20 20 20 63 20 3d 20  80 ){.      c = 
1b60: 28 63 26 30 78 30 37 29 3c 3c 31 38 20 7c 20 28  (c&0x07)<<18 | (
1b70: 28 70 2d 3e 7a 5b 70 2d 3e 69 5d 26 30 78 33 66  (p->z[p->i]&0x3f
1b80: 29 3c 3c 31 32 29 20 7c 20 28 28 70 2d 3e 7a 5b  )<<12) | ((p->z[
1b90: 70 2d 3e 69 2b 31 5d 26 30 78 33 66 29 3c 3c 36  p->i+1]&0x3f)<<6
1ba0: 29 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ).              
1bb0: 20 20 20 20 20 20 20 20 20 7c 20 28 70 2d 3e 7a           | (p->z
1bc0: 5b 70 2d 3e 69 2b 32 5d 26 30 78 33 66 29 3b 0a  [p->i+2]&0x3f);.
1bd0: 20 20 20 20 20 20 70 2d 3e 69 20 2b 3d 20 33 3b        p->i += 3;
1be0: 0a 20 20 20 20 20 20 69 66 28 20 63 3c 3d 30 78  .      if( c<=0x
1bf0: 66 66 66 66 20 7c 7c 20 63 3e 30 78 31 30 66 66  ffff || c>0x10ff
1c00: 66 66 20 29 20 63 20 3d 20 30 78 66 66 66 64 3b  ff ) c = 0xfffd;
1c10: 0a 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20  .    }else{.    
1c20: 20 20 63 20 3d 20 30 78 66 66 66 64 3b 0a 20 20    c = 0xfffd;.  
1c30: 20 20 7d 0a 20 20 7d 0a 20 20 72 65 74 75 72 6e    }.  }.  return
1c40: 20 63 3b 0a 7d 0a 73 74 61 74 69 63 20 75 6e 73   c;.}.static uns
1c50: 69 67 6e 65 64 20 72 65 5f 6e 65 78 74 5f 63 68  igned re_next_ch
1c60: 61 72 5f 6e 6f 63 61 73 65 28 52 65 49 6e 70 75  ar_nocase(ReInpu
1c70: 74 20 2a 70 29 7b 0a 20 20 75 6e 73 69 67 6e 65  t *p){.  unsigne
1c80: 64 20 63 20 3d 20 72 65 5f 6e 65 78 74 5f 63 68  d c = re_next_ch
1c90: 61 72 28 70 29 3b 0a 20 20 69 66 28 20 63 3e 3d  ar(p);.  if( c>=
1ca0: 27 41 27 20 26 26 20 63 3c 3d 27 5a 27 20 29 20  'A' && c<='Z' ) 
1cb0: 63 20 2b 3d 20 27 61 27 20 2d 20 27 41 27 3b 0a  c += 'a' - 'A';.
1cc0: 20 20 72 65 74 75 72 6e 20 63 3b 0a 7d 0a 0a 2f    return c;.}../
1cd0: 2a 20 52 65 74 75 72 6e 20 74 72 75 65 20 69 66  * Return true if
1ce0: 20 63 20 69 73 20 61 20 70 65 72 6c 20 22 77 6f   c is a perl "wo
1cf0: 72 64 22 20 63 68 61 72 61 63 74 65 72 3a 20 20  rd" character:  
1d00: 5b 41 2d 5a 61 2d 7a 30 2d 39 5f 5d 20 2a 2f 0a  [A-Za-z0-9_] */.
1d10: 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 77 6f  static int re_wo
1d20: 72 64 5f 63 68 61 72 28 69 6e 74 20 63 29 7b 0a  rd_char(int c){.
1d30: 20 20 72 65 74 75 72 6e 20 28 63 3e 3d 27 30 27    return (c>='0'
1d40: 20 26 26 20 63 3c 3d 27 39 27 29 20 7c 7c 20 28   && c<='9') || (
1d50: 63 3e 3d 27 61 27 20 26 26 20 63 3c 3d 27 7a 27  c>='a' && c<='z'
1d60: 29 0a 20 20 20 20 20 20 7c 7c 20 28 63 3e 3d 27  ).      || (c>='
1d70: 41 27 20 26 26 20 63 3c 3d 27 5a 27 29 20 7c 7c  A' && c<='Z') ||
1d80: 20 63 3d 3d 27 5f 27 3b 0a 7d 0a 0a 2f 2a 20 52   c=='_';.}../* R
1d90: 65 74 75 72 6e 20 74 72 75 65 20 69 66 20 63 20  eturn true if c 
1da0: 69 73 20 61 20 22 64 69 67 69 74 22 20 63 68 61  is a "digit" cha
1db0: 72 61 63 74 65 72 3a 20 20 5b 30 2d 39 5d 20 2a  racter:  [0-9] *
1dc0: 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f  /.static int re_
1dd0: 64 69 67 69 74 5f 63 68 61 72 28 69 6e 74 20 63  digit_char(int c
1de0: 29 7b 0a 20 20 72 65 74 75 72 6e 20 28 63 3e 3d  ){.  return (c>=
1df0: 27 30 27 20 26 26 20 63 3c 3d 27 39 27 29 3b 0a  '0' && c<='9');.
1e00: 7d 0a 0a 2f 2a 20 52 65 74 75 72 6e 20 74 72 75  }../* Return tru
1e10: 65 20 69 66 20 63 20 69 73 20 61 20 70 65 72 6c  e if c is a perl
1e20: 20 22 73 70 61 63 65 22 20 63 68 61 72 61 63 74   "space" charact
1e30: 65 72 3a 20 20 5b 20 5c 74 5c 72 5c 6e 5c 76 5c  er:  [ \t\r\n\v\
1e40: 66 5d 20 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74  f] */.static int
1e50: 20 72 65 5f 73 70 61 63 65 5f 63 68 61 72 28 69   re_space_char(i
1e60: 6e 74 20 63 29 7b 0a 20 20 72 65 74 75 72 6e 20  nt c){.  return 
1e70: 63 3d 3d 27 20 27 20 7c 7c 20 63 3d 3d 27 5c 74  c==' ' || c=='\t
1e80: 27 20 7c 7c 20 63 3d 3d 27 5c 6e 27 20 7c 7c 20  ' || c=='\n' || 
1e90: 63 3d 3d 27 5c 72 27 20 7c 7c 20 63 3d 3d 27 5c  c=='\r' || c=='\
1ea0: 76 27 20 7c 7c 20 63 3d 3d 27 5c 66 27 3b 0a 7d  v' || c=='\f';.}
1eb0: 0a 0a 2f 2a 20 52 75 6e 20 61 20 63 6f 6d 70 69  ../* Run a compi
1ec0: 6c 65 64 20 72 65 67 75 6c 61 72 20 65 78 70 72  led regular expr
1ed0: 65 73 73 69 6f 6e 20 6f 6e 20 74 68 65 20 7a 65  ession on the ze
1ee0: 72 6f 2d 74 65 72 6d 69 6e 61 74 65 64 20 69 6e  ro-terminated in
1ef0: 70 75 74 0a 2a 2a 20 73 74 72 69 6e 67 20 7a 49  put.** string zI
1f00: 6e 5b 5d 2e 20 20 52 65 74 75 72 6e 20 74 72 75  n[].  Return tru
1f10: 65 20 6f 6e 20 61 20 6d 61 74 63 68 20 61 6e 64  e on a match and
1f20: 20 66 61 6c 73 65 20 69 66 20 74 68 65 72 65 20   false if there 
1f30: 69 73 20 6e 6f 20 6d 61 74 63 68 2e 0a 2a 2f 0a  is no match..*/.
1f40: 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 6d 61  static int re_ma
1f50: 74 63 68 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a  tch(ReCompiled *
1f60: 70 52 65 2c 20 63 6f 6e 73 74 20 75 6e 73 69 67  pRe, const unsig
1f70: 6e 65 64 20 63 68 61 72 20 2a 7a 49 6e 2c 20 69  ned char *zIn, i
1f80: 6e 74 20 6e 49 6e 29 7b 0a 20 20 52 65 53 74 61  nt nIn){.  ReSta
1f90: 74 65 53 65 74 20 61 53 74 61 74 65 53 65 74 5b  teSet aStateSet[
1fa0: 32 5d 2c 20 2a 70 54 68 69 73 2c 20 2a 70 4e 65  2], *pThis, *pNe
1fb0: 78 74 3b 0a 20 20 52 65 53 74 61 74 65 4e 75 6d  xt;.  ReStateNum
1fc0: 62 65 72 20 61 53 70 61 63 65 5b 31 30 30 5d 3b  ber aSpace[100];
1fd0: 0a 20 20 52 65 53 74 61 74 65 4e 75 6d 62 65 72  .  ReStateNumber
1fe0: 20 2a 70 54 6f 46 72 65 65 3b 0a 20 20 75 6e 73   *pToFree;.  uns
1ff0: 69 67 6e 65 64 20 69 6e 74 20 69 20 3d 20 30 3b  igned int i = 0;
2000: 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74 20  .  unsigned int 
2010: 69 53 77 61 70 20 3d 20 30 3b 0a 20 20 69 6e 74  iSwap = 0;.  int
2020: 20 63 20 3d 20 52 45 5f 45 4f 46 2b 31 3b 0a 20   c = RE_EOF+1;. 
2030: 20 69 6e 74 20 63 50 72 65 76 20 3d 20 30 3b 0a   int cPrev = 0;.
2040: 20 20 69 6e 74 20 72 63 20 3d 20 30 3b 0a 20 20    int rc = 0;.  
2050: 52 65 49 6e 70 75 74 20 69 6e 3b 0a 0a 20 20 69  ReInput in;..  i
2060: 6e 2e 7a 20 3d 20 7a 49 6e 3b 0a 20 20 69 6e 2e  n.z = zIn;.  in.
2070: 69 20 3d 20 30 3b 0a 20 20 69 6e 2e 6d 78 20 3d  i = 0;.  in.mx =
2080: 20 6e 49 6e 3e 3d 30 20 3f 20 6e 49 6e 20 3a 20   nIn>=0 ? nIn : 
2090: 28 69 6e 74 29 73 74 72 6c 65 6e 28 28 63 68 61  (int)strlen((cha
20a0: 72 20 63 6f 6e 73 74 2a 29 7a 49 6e 29 3b 0a 0a  r const*)zIn);..
20b0: 20 20 2f 2a 20 4c 6f 6f 6b 20 66 6f 72 20 74 68    /* Look for th
20c0: 65 20 69 6e 69 74 69 61 6c 20 70 72 65 66 69 78  e initial prefix
20d0: 20 6d 61 74 63 68 2c 20 69 66 20 74 68 65 72 65   match, if there
20e0: 20 69 73 20 6f 6e 65 2e 20 2a 2f 0a 20 20 69 66   is one. */.  if
20f0: 28 20 70 52 65 2d 3e 6e 49 6e 69 74 20 29 7b 0a  ( pRe->nInit ){.
2100: 20 20 20 20 75 6e 73 69 67 6e 65 64 20 63 68 61      unsigned cha
2110: 72 20 78 20 3d 20 70 52 65 2d 3e 7a 49 6e 69 74  r x = pRe->zInit
2120: 5b 30 5d 3b 0a 20 20 20 20 77 68 69 6c 65 28 20  [0];.    while( 
2130: 69 6e 2e 69 2b 70 52 65 2d 3e 6e 49 6e 69 74 3c  in.i+pRe->nInit<
2140: 3d 69 6e 2e 6d 78 20 0a 20 20 20 20 20 26 26 20  =in.mx .     && 
2150: 28 7a 49 6e 5b 69 6e 2e 69 5d 21 3d 78 20 7c 7c  (zIn[in.i]!=x ||
2160: 0a 20 20 20 20 20 20 20 20 20 73 74 72 6e 63 6d  .         strncm
2170: 70 28 28 63 6f 6e 73 74 20 63 68 61 72 2a 29 7a  p((const char*)z
2180: 49 6e 2b 69 6e 2e 69 2c 20 28 63 6f 6e 73 74 20  In+in.i, (const 
2190: 63 68 61 72 2a 29 70 52 65 2d 3e 7a 49 6e 69 74  char*)pRe->zInit
21a0: 2c 20 70 52 65 2d 3e 6e 49 6e 69 74 29 21 3d 30  , pRe->nInit)!=0
21b0: 29 0a 20 20 20 20 29 7b 0a 20 20 20 20 20 20 69  ).    ){.      i
21c0: 6e 2e 69 2b 2b 3b 0a 20 20 20 20 7d 0a 20 20 20  n.i++;.    }.   
21d0: 20 69 66 28 20 69 6e 2e 69 2b 70 52 65 2d 3e 6e   if( in.i+pRe->n
21e0: 49 6e 69 74 3e 69 6e 2e 6d 78 20 29 20 72 65 74  Init>in.mx ) ret
21f0: 75 72 6e 20 30 3b 0a 20 20 7d 0a 0a 20 20 69 66  urn 0;.  }..  if
2200: 28 20 70 52 65 2d 3e 6e 53 74 61 74 65 3c 3d 28  ( pRe->nState<=(
2210: 73 69 7a 65 6f 66 28 61 53 70 61 63 65 29 2f 28  sizeof(aSpace)/(
2220: 73 69 7a 65 6f 66 28 61 53 70 61 63 65 5b 30 5d  sizeof(aSpace[0]
2230: 29 2a 32 29 29 20 29 7b 0a 20 20 20 20 70 54 6f  )*2)) ){.    pTo
2240: 46 72 65 65 20 3d 20 30 3b 0a 20 20 20 20 61 53  Free = 0;.    aS
2250: 74 61 74 65 53 65 74 5b 30 5d 2e 61 53 74 61 74  tateSet[0].aStat
2260: 65 20 3d 20 61 53 70 61 63 65 3b 0a 20 20 7d 65  e = aSpace;.  }e
2270: 6c 73 65 7b 0a 20 20 20 20 70 54 6f 46 72 65 65  lse{.    pToFree
2280: 20 3d 20 73 71 6c 69 74 65 33 5f 6d 61 6c 6c 6f   = sqlite3_mallo
2290: 63 36 34 28 20 73 69 7a 65 6f 66 28 52 65 53 74  c64( sizeof(ReSt
22a0: 61 74 65 4e 75 6d 62 65 72 29 2a 32 2a 70 52 65  ateNumber)*2*pRe
22b0: 2d 3e 6e 53 74 61 74 65 20 29 3b 0a 20 20 20 20  ->nState );.    
22c0: 69 66 28 20 70 54 6f 46 72 65 65 3d 3d 30 20 29  if( pToFree==0 )
22d0: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20   return -1;.    
22e0: 61 53 74 61 74 65 53 65 74 5b 30 5d 2e 61 53 74  aStateSet[0].aSt
22f0: 61 74 65 20 3d 20 70 54 6f 46 72 65 65 3b 0a 20  ate = pToFree;. 
2300: 20 7d 0a 20 20 61 53 74 61 74 65 53 65 74 5b 31   }.  aStateSet[1
2310: 5d 2e 61 53 74 61 74 65 20 3d 20 26 61 53 74 61  ].aState = &aSta
2320: 74 65 53 65 74 5b 30 5d 2e 61 53 74 61 74 65 5b  teSet[0].aState[
2330: 70 52 65 2d 3e 6e 53 74 61 74 65 5d 3b 0a 20 20  pRe->nState];.  
2340: 70 4e 65 78 74 20 3d 20 26 61 53 74 61 74 65 53  pNext = &aStateS
2350: 65 74 5b 31 5d 3b 0a 20 20 70 4e 65 78 74 2d 3e  et[1];.  pNext->
2360: 6e 53 74 61 74 65 20 3d 20 30 3b 0a 20 20 72 65  nState = 0;.  re
2370: 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74  _add_state(pNext
2380: 2c 20 30 29 3b 0a 20 20 77 68 69 6c 65 28 20 63  , 0);.  while( c
2390: 21 3d 52 45 5f 45 4f 46 20 26 26 20 70 4e 65 78  !=RE_EOF && pNex
23a0: 74 2d 3e 6e 53 74 61 74 65 3e 30 20 29 7b 0a 20  t->nState>0 ){. 
23b0: 20 20 20 63 50 72 65 76 20 3d 20 63 3b 0a 20 20     cPrev = c;.  
23c0: 20 20 63 20 3d 20 70 52 65 2d 3e 78 4e 65 78 74    c = pRe->xNext
23d0: 43 68 61 72 28 26 69 6e 29 3b 0a 20 20 20 20 70  Char(&in);.    p
23e0: 54 68 69 73 20 3d 20 70 4e 65 78 74 3b 0a 20 20  This = pNext;.  
23f0: 20 20 70 4e 65 78 74 20 3d 20 26 61 53 74 61 74    pNext = &aStat
2400: 65 53 65 74 5b 69 53 77 61 70 5d 3b 0a 20 20 20  eSet[iSwap];.   
2410: 20 69 53 77 61 70 20 3d 20 31 20 2d 20 69 53 77   iSwap = 1 - iSw
2420: 61 70 3b 0a 20 20 20 20 70 4e 65 78 74 2d 3e 6e  ap;.    pNext->n
2430: 53 74 61 74 65 20 3d 20 30 3b 0a 20 20 20 20 66  State = 0;.    f
2440: 6f 72 28 69 3d 30 3b 20 69 3c 70 54 68 69 73 2d  or(i=0; i<pThis-
2450: 3e 6e 53 74 61 74 65 3b 20 69 2b 2b 29 7b 0a 20  >nState; i++){. 
2460: 20 20 20 20 20 69 6e 74 20 78 20 3d 20 70 54 68       int x = pTh
2470: 69 73 2d 3e 61 53 74 61 74 65 5b 69 5d 3b 0a 20  is->aState[i];. 
2480: 20 20 20 20 20 73 77 69 74 63 68 28 20 70 52 65       switch( pRe
2490: 2d 3e 61 4f 70 5b 78 5d 20 29 7b 0a 20 20 20 20  ->aOp[x] ){.    
24a0: 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4d      case RE_OP_M
24b0: 41 54 43 48 3a 20 7b 0a 20 20 20 20 20 20 20 20  ATCH: {.        
24c0: 20 20 69 66 28 20 70 52 65 2d 3e 61 41 72 67 5b    if( pRe->aArg[
24d0: 78 5d 3d 3d 63 20 29 20 72 65 5f 61 64 64 5f 73  x]==c ) re_add_s
24e0: 74 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29  tate(pNext, x+1)
24f0: 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61  ;.          brea
2500: 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20  k;.        }.   
2510: 20 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f       case RE_OP_
2520: 41 4e 59 3a 20 7b 0a 20 20 20 20 20 20 20 20 20  ANY: {.         
2530: 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e   re_add_state(pN
2540: 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20  ext, x+1);.     
2550: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
2560: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61      }.        ca
2570: 73 65 20 52 45 5f 4f 50 5f 57 4f 52 44 3a 20 7b  se RE_OP_WORD: {
2580: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 72  .          if( r
2590: 65 5f 77 6f 72 64 5f 63 68 61 72 28 63 29 20 29  e_word_char(c) )
25a0: 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e   re_add_state(pN
25b0: 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20  ext, x+1);.     
25c0: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
25d0: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61      }.        ca
25e0: 73 65 20 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44  se RE_OP_NOTWORD
25f0: 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66  : {.          if
2600: 28 20 21 72 65 5f 77 6f 72 64 5f 63 68 61 72 28  ( !re_word_char(
2610: 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74  c) ) re_add_stat
2620: 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20  e(pNext, x+1);. 
2630: 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a           break;.
2640: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
2650: 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 44 49 47    case RE_OP_DIG
2660: 49 54 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20  IT: {.          
2670: 69 66 28 20 72 65 5f 64 69 67 69 74 5f 63 68 61  if( re_digit_cha
2680: 72 28 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74  r(c) ) re_add_st
2690: 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b  ate(pNext, x+1);
26a0: 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b  .          break
26b0: 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  ;.        }.    
26c0: 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4e      case RE_OP_N
26d0: 4f 54 44 49 47 49 54 3a 20 7b 0a 20 20 20 20 20  OTDIGIT: {.     
26e0: 20 20 20 20 20 69 66 28 20 21 72 65 5f 64 69 67       if( !re_dig
26f0: 69 74 5f 63 68 61 72 28 63 29 20 29 20 72 65 5f  it_char(c) ) re_
2700: 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c  add_state(pNext,
2710: 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20   x+1);.         
2720: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20   break;.        
2730: 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52  }.        case R
2740: 45 5f 4f 50 5f 53 50 41 43 45 3a 20 7b 0a 20 20  E_OP_SPACE: {.  
2750: 20 20 20 20 20 20 20 20 69 66 28 20 72 65 5f 73          if( re_s
2760: 70 61 63 65 5f 63 68 61 72 28 63 29 20 29 20 72  pace_char(c) ) r
2770: 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78  e_add_state(pNex
2780: 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20  t, x+1);.       
2790: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20     break;.      
27a0: 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65    }.        case
27b0: 20 52 45 5f 4f 50 5f 4e 4f 54 53 50 41 43 45 3a   RE_OP_NOTSPACE:
27c0: 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28   {.          if(
27d0: 20 21 72 65 5f 73 70 61 63 65 5f 63 68 61 72 28   !re_space_char(
27e0: 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74  c) ) re_add_stat
27f0: 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20  e(pNext, x+1);. 
2800: 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a           break;.
2810: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
2820: 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 42 4f 55    case RE_OP_BOU
2830: 4e 44 41 52 59 3a 20 7b 0a 20 20 20 20 20 20 20  NDARY: {.       
2840: 20 20 20 69 66 28 20 72 65 5f 77 6f 72 64 5f 63     if( re_word_c
2850: 68 61 72 28 63 29 21 3d 72 65 5f 77 6f 72 64 5f  har(c)!=re_word_
2860: 63 68 61 72 28 63 50 72 65 76 29 20 29 20 72 65  char(cPrev) ) re
2870: 5f 61 64 64 5f 73 74 61 74 65 28 70 54 68 69 73  _add_state(pThis
2880: 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20  , x+1);.        
2890: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20    break;.       
28a0: 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20   }.        case 
28b0: 52 45 5f 4f 50 5f 41 4e 59 53 54 41 52 3a 20 7b  RE_OP_ANYSTAR: {
28c0: 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 64  .          re_ad
28d0: 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20 78  d_state(pNext, x
28e0: 29 3b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f  );.          re_
28f0: 61 64 64 5f 73 74 61 74 65 28 70 54 68 69 73 2c  add_state(pThis,
2900: 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20   x+1);.         
2910: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20   break;.        
2920: 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52  }.        case R
2930: 45 5f 4f 50 5f 46 4f 52 4b 3a 20 7b 0a 20 20 20  E_OP_FORK: {.   
2940: 20 20 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74         re_add_st
2950: 61 74 65 28 70 54 68 69 73 2c 20 78 2b 70 52 65  ate(pThis, x+pRe
2960: 2d 3e 61 41 72 67 5b 78 5d 29 3b 0a 20 20 20 20  ->aArg[x]);.    
2970: 20 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74 61        re_add_sta
2980: 74 65 28 70 54 68 69 73 2c 20 78 2b 31 29 3b 0a  te(pThis, x+1);.
2990: 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b            break;
29a0: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20  .        }.     
29b0: 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 47 4f     case RE_OP_GO
29c0: 54 4f 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20  TO: {.          
29d0: 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 54 68  re_add_state(pTh
29e0: 69 73 2c 20 78 2b 70 52 65 2d 3e 61 41 72 67 5b  is, x+pRe->aArg[
29f0: 78 5d 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62  x]);.          b
2a00: 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a  reak;.        }.
2a10: 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f          case RE_
2a20: 4f 50 5f 41 43 43 45 50 54 3a 20 7b 0a 20 20 20  OP_ACCEPT: {.   
2a30: 20 20 20 20 20 20 20 72 63 20 3d 20 31 3b 0a 20         rc = 1;. 
2a40: 20 20 20 20 20 20 20 20 20 67 6f 74 6f 20 72 65           goto re
2a50: 5f 6d 61 74 63 68 5f 65 6e 64 3b 0a 20 20 20 20  _match_end;.    
2a60: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61      }.        ca
2a70: 73 65 20 52 45 5f 4f 50 5f 43 43 5f 49 4e 43 3a  se RE_OP_CC_INC:
2a80: 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45  .        case RE
2a90: 5f 4f 50 5f 43 43 5f 45 58 43 3a 20 7b 0a 20 20  _OP_CC_EXC: {.  
2aa0: 20 20 20 20 20 20 20 20 69 6e 74 20 6a 20 3d 20          int j = 
2ab0: 31 3b 0a 20 20 20 20 20 20 20 20 20 20 69 6e 74  1;.          int
2ac0: 20 6e 20 3d 20 70 52 65 2d 3e 61 41 72 67 5b 78   n = pRe->aArg[x
2ad0: 5d 3b 0a 20 20 20 20 20 20 20 20 20 20 69 6e 74  ];.          int
2ae0: 20 68 69 74 20 3d 20 30 3b 0a 20 20 20 20 20 20   hit = 0;.      
2af0: 20 20 20 20 66 6f 72 28 6a 3d 31 3b 20 6a 3e 30      for(j=1; j>0
2b00: 20 26 26 20 6a 3c 6e 3b 20 6a 2b 2b 29 7b 0a 20   && j<n; j++){. 
2b10: 20 20 20 20 20 20 20 20 20 20 20 69 66 28 20 70             if( p
2b20: 52 65 2d 3e 61 4f 70 5b 78 2b 6a 5d 3d 3d 52 45  Re->aOp[x+j]==RE
2b30: 5f 4f 50 5f 43 43 5f 56 41 4c 55 45 20 29 7b 0a  _OP_CC_VALUE ){.
2b40: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 69 66                if
2b50: 28 20 70 52 65 2d 3e 61 41 72 67 5b 78 2b 6a 5d  ( pRe->aArg[x+j]
2b60: 3d 3d 63 20 29 7b 0a 20 20 20 20 20 20 20 20 20  ==c ){.         
2b70: 20 20 20 20 20 20 20 68 69 74 20 3d 20 31 3b 0a         hit = 1;.
2b80: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2b90: 6a 20 3d 20 2d 31 3b 0a 20 20 20 20 20 20 20 20  j = -1;.        
2ba0: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
2bb0: 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20      }else{.     
2bc0: 20 20 20 20 20 20 20 20 20 69 66 28 20 70 52 65           if( pRe
2bd0: 2d 3e 61 41 72 67 5b 78 2b 6a 5d 3c 3d 63 20 26  ->aArg[x+j]<=c &
2be0: 26 20 70 52 65 2d 3e 61 41 72 67 5b 78 2b 6a 2b  & pRe->aArg[x+j+
2bf0: 31 5d 3e 3d 63 20 29 7b 0a 20 20 20 20 20 20 20  1]>=c ){.       
2c00: 20 20 20 20 20 20 20 20 20 68 69 74 20 3d 20 31           hit = 1
2c10: 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ;.              
2c20: 20 20 6a 20 3d 20 2d 31 3b 0a 20 20 20 20 20 20    j = -1;.      
2c30: 20 20 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20          }else{. 
2c40: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 6a                 j
2c50: 2b 2b 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20  ++;.            
2c60: 20 20 7d 0a 20 20 20 20 20 20 20 20 20 20 20 20    }.            
2c70: 7d 0a 20 20 20 20 20 20 20 20 20 20 7d 0a 20 20  }.          }.  
2c80: 20 20 20 20 20 20 20 20 69 66 28 20 70 52 65 2d          if( pRe-
2c90: 3e 61 4f 70 5b 78 5d 3d 3d 52 45 5f 4f 50 5f 43  >aOp[x]==RE_OP_C
2ca0: 43 5f 45 58 43 20 29 20 68 69 74 20 3d 20 21 68  C_EXC ) hit = !h
2cb0: 69 74 3b 0a 20 20 20 20 20 20 20 20 20 20 69 66  it;.          if
2cc0: 28 20 68 69 74 20 29 20 72 65 5f 61 64 64 5f 73  ( hit ) re_add_s
2cd0: 74 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 6e 29  tate(pNext, x+n)
2ce0: 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61  ;.          brea
2cf0: 6b 3b 20 20 20 20 20 20 20 20 20 20 20 20 0a 20  k;            . 
2d00: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 7d         }.      }
2d10: 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20 66 6f 72  .    }.  }.  for
2d20: 28 69 3d 30 3b 20 69 3c 70 4e 65 78 74 2d 3e 6e  (i=0; i<pNext->n
2d30: 53 74 61 74 65 3b 20 69 2b 2b 29 7b 0a 20 20 20  State; i++){.   
2d40: 20 69 66 28 20 70 52 65 2d 3e 61 4f 70 5b 70 4e   if( pRe->aOp[pN
2d50: 65 78 74 2d 3e 61 53 74 61 74 65 5b 69 5d 5d 3d  ext->aState[i]]=
2d60: 3d 52 45 5f 4f 50 5f 41 43 43 45 50 54 20 29 7b  =RE_OP_ACCEPT ){
2d70: 20 72 63 20 3d 20 31 3b 20 62 72 65 61 6b 3b 20   rc = 1; break; 
2d80: 7d 0a 20 20 7d 0a 72 65 5f 6d 61 74 63 68 5f 65  }.  }.re_match_e
2d90: 6e 64 3a 0a 20 20 73 71 6c 69 74 65 33 5f 66 72  nd:.  sqlite3_fr
2da0: 65 65 28 70 54 6f 46 72 65 65 29 3b 0a 20 20 72  ee(pToFree);.  r
2db0: 65 74 75 72 6e 20 72 63 3b 0a 7d 0a 0a 2f 2a 20  eturn rc;.}../* 
2dc0: 52 65 73 69 7a 65 20 74 68 65 20 6f 70 63 6f 64  Resize the opcod
2dd0: 65 20 61 6e 64 20 61 72 67 75 6d 65 6e 74 20 61  e and argument a
2de0: 72 72 61 79 73 20 66 6f 72 20 61 6e 20 52 45 20  rrays for an RE 
2df0: 75 6e 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69  under constructi
2e00: 6f 6e 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e  on..*/.static in
2e10: 74 20 72 65 5f 72 65 73 69 7a 65 28 52 65 43 6f  t re_resize(ReCo
2e20: 6d 70 69 6c 65 64 20 2a 70 2c 20 69 6e 74 20 4e  mpiled *p, int N
2e30: 29 7b 0a 20 20 63 68 61 72 20 2a 61 4f 70 3b 0a  ){.  char *aOp;.
2e40: 20 20 69 6e 74 20 2a 61 41 72 67 3b 0a 20 20 61    int *aArg;.  a
2e50: 4f 70 20 3d 20 73 71 6c 69 74 65 33 5f 72 65 61  Op = sqlite3_rea
2e60: 6c 6c 6f 63 36 34 28 70 2d 3e 61 4f 70 2c 20 4e  lloc64(p->aOp, N
2e70: 2a 73 69 7a 65 6f 66 28 70 2d 3e 61 4f 70 5b 30  *sizeof(p->aOp[0
2e80: 5d 29 29 3b 0a 20 20 69 66 28 20 61 4f 70 3d 3d  ]));.  if( aOp==
2e90: 30 20 29 20 72 65 74 75 72 6e 20 31 3b 0a 20 20  0 ) return 1;.  
2ea0: 70 2d 3e 61 4f 70 20 3d 20 61 4f 70 3b 0a 20 20  p->aOp = aOp;.  
2eb0: 61 41 72 67 20 3d 20 73 71 6c 69 74 65 33 5f 72  aArg = sqlite3_r
2ec0: 65 61 6c 6c 6f 63 36 34 28 70 2d 3e 61 41 72 67  ealloc64(p->aArg
2ed0: 2c 20 4e 2a 73 69 7a 65 6f 66 28 70 2d 3e 61 41  , N*sizeof(p->aA
2ee0: 72 67 5b 30 5d 29 29 3b 0a 20 20 69 66 28 20 61  rg[0]));.  if( a
2ef0: 41 72 67 3d 3d 30 20 29 20 72 65 74 75 72 6e 20  Arg==0 ) return 
2f00: 31 3b 0a 20 20 70 2d 3e 61 41 72 67 20 3d 20 61  1;.  p->aArg = a
2f10: 41 72 67 3b 0a 20 20 70 2d 3e 6e 41 6c 6c 6f 63  Arg;.  p->nAlloc
2f20: 20 3d 20 4e 3b 0a 20 20 72 65 74 75 72 6e 20 30   = N;.  return 0
2f30: 3b 0a 7d 0a 0a 2f 2a 20 49 6e 73 65 72 74 20 61  ;.}../* Insert a
2f40: 20 6e 65 77 20 6f 70 63 6f 64 65 20 61 6e 64 20   new opcode and 
2f50: 61 72 67 75 6d 65 6e 74 20 69 6e 74 6f 20 61 6e  argument into an
2f60: 20 52 45 20 75 6e 64 65 72 20 63 6f 6e 73 74 72   RE under constr
2f70: 75 63 74 69 6f 6e 2e 20 20 54 68 65 0a 2a 2a 20  uction.  The.** 
2f80: 69 6e 73 65 72 74 69 6f 6e 20 70 6f 69 6e 74 20  insertion point 
2f90: 69 73 20 6a 75 73 74 20 70 72 69 6f 72 20 74 6f  is just prior to
2fa0: 20 65 78 69 73 74 69 6e 67 20 6f 70 63 6f 64 65   existing opcode
2fb0: 20 69 42 65 66 6f 72 65 2e 0a 2a 2f 0a 73 74 61   iBefore..*/.sta
2fc0: 74 69 63 20 69 6e 74 20 72 65 5f 69 6e 73 65 72  tic int re_inser
2fd0: 74 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 2c  t(ReCompiled *p,
2fe0: 20 69 6e 74 20 69 42 65 66 6f 72 65 2c 20 69 6e   int iBefore, in
2ff0: 74 20 6f 70 2c 20 69 6e 74 20 61 72 67 29 7b 0a  t op, int arg){.
3000: 20 20 69 6e 74 20 69 3b 0a 20 20 69 66 28 20 70    int i;.  if( p
3010: 2d 3e 6e 41 6c 6c 6f 63 3c 3d 70 2d 3e 6e 53 74  ->nAlloc<=p->nSt
3020: 61 74 65 20 26 26 20 72 65 5f 72 65 73 69 7a 65  ate && re_resize
3030: 28 70 2c 20 70 2d 3e 6e 41 6c 6c 6f 63 2a 32 29  (p, p->nAlloc*2)
3040: 20 29 20 72 65 74 75 72 6e 20 30 3b 0a 20 20 66   ) return 0;.  f
3050: 6f 72 28 69 3d 70 2d 3e 6e 53 74 61 74 65 3b 20  or(i=p->nState; 
3060: 69 3e 69 42 65 66 6f 72 65 3b 20 69 2d 2d 29 7b  i>iBefore; i--){
3070: 0a 20 20 20 20 70 2d 3e 61 4f 70 5b 69 5d 20 3d  .    p->aOp[i] =
3080: 20 70 2d 3e 61 4f 70 5b 69 2d 31 5d 3b 0a 20 20   p->aOp[i-1];.  
3090: 20 20 70 2d 3e 61 41 72 67 5b 69 5d 20 3d 20 70    p->aArg[i] = p
30a0: 2d 3e 61 41 72 67 5b 69 2d 31 5d 3b 0a 20 20 7d  ->aArg[i-1];.  }
30b0: 0a 20 20 70 2d 3e 6e 53 74 61 74 65 2b 2b 3b 0a  .  p->nState++;.
30c0: 20 20 70 2d 3e 61 4f 70 5b 69 42 65 66 6f 72 65    p->aOp[iBefore
30d0: 5d 20 3d 20 28 63 68 61 72 29 6f 70 3b 0a 20 20  ] = (char)op;.  
30e0: 70 2d 3e 61 41 72 67 5b 69 42 65 66 6f 72 65 5d  p->aArg[iBefore]
30f0: 20 3d 20 61 72 67 3b 0a 20 20 72 65 74 75 72 6e   = arg;.  return
3100: 20 69 42 65 66 6f 72 65 3b 0a 7d 0a 0a 2f 2a 20   iBefore;.}../* 
3110: 41 70 70 65 6e 64 20 61 20 6e 65 77 20 6f 70 63  Append a new opc
3120: 6f 64 65 20 61 6e 64 20 61 72 67 75 6d 65 6e 74  ode and argument
3130: 20 74 6f 20 74 68 65 20 65 6e 64 20 6f 66 20 74   to the end of t
3140: 68 65 20 52 45 20 75 6e 64 65 72 20 63 6f 6e 73  he RE under cons
3150: 74 72 75 63 74 69 6f 6e 2e 0a 2a 2f 0a 73 74 61  truction..*/.sta
3160: 74 69 63 20 69 6e 74 20 72 65 5f 61 70 70 65 6e  tic int re_appen
3170: 64 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 2c  d(ReCompiled *p,
3180: 20 69 6e 74 20 6f 70 2c 20 69 6e 74 20 61 72 67   int op, int arg
3190: 29 7b 0a 20 20 72 65 74 75 72 6e 20 72 65 5f 69  ){.  return re_i
31a0: 6e 73 65 72 74 28 70 2c 20 70 2d 3e 6e 53 74 61  nsert(p, p->nSta
31b0: 74 65 2c 20 6f 70 2c 20 61 72 67 29 3b 0a 7d 0a  te, op, arg);.}.
31c0: 0a 2f 2a 20 4d 61 6b 65 20 61 20 63 6f 70 79 20  ./* Make a copy 
31d0: 6f 66 20 4e 20 6f 70 63 6f 64 65 73 20 73 74 61  of N opcodes sta
31e0: 72 74 69 6e 67 20 61 74 20 69 53 74 61 72 74 20  rting at iStart 
31f0: 6f 6e 74 6f 20 74 68 65 20 65 6e 64 20 6f 66 20  onto the end of 
3200: 74 68 65 20 52 45 0a 2a 2a 20 75 6e 64 65 72 20  the RE.** under 
3210: 63 6f 6e 73 74 72 75 63 74 69 6f 6e 2e 0a 2a 2f  construction..*/
3220: 0a 73 74 61 74 69 63 20 76 6f 69 64 20 72 65 5f  .static void re_
3230: 63 6f 70 79 28 52 65 43 6f 6d 70 69 6c 65 64 20  copy(ReCompiled 
3240: 2a 70 2c 20 69 6e 74 20 69 53 74 61 72 74 2c 20  *p, int iStart, 
3250: 69 6e 74 20 4e 29 7b 0a 20 20 69 66 28 20 70 2d  int N){.  if( p-
3260: 3e 6e 53 74 61 74 65 2b 4e 3e 3d 70 2d 3e 6e 41  >nState+N>=p->nA
3270: 6c 6c 6f 63 20 26 26 20 72 65 5f 72 65 73 69 7a  lloc && re_resiz
3280: 65 28 70 2c 20 70 2d 3e 6e 41 6c 6c 6f 63 2a 32  e(p, p->nAlloc*2
3290: 2b 4e 29 20 29 20 72 65 74 75 72 6e 3b 0a 20 20  +N) ) return;.  
32a0: 6d 65 6d 63 70 79 28 26 70 2d 3e 61 4f 70 5b 70  memcpy(&p->aOp[p
32b0: 2d 3e 6e 53 74 61 74 65 5d 2c 20 26 70 2d 3e 61  ->nState], &p->a
32c0: 4f 70 5b 69 53 74 61 72 74 5d 2c 20 4e 2a 73 69  Op[iStart], N*si
32d0: 7a 65 6f 66 28 70 2d 3e 61 4f 70 5b 30 5d 29 29  zeof(p->aOp[0]))
32e0: 3b 0a 20 20 6d 65 6d 63 70 79 28 26 70 2d 3e 61  ;.  memcpy(&p->a
32f0: 41 72 67 5b 70 2d 3e 6e 53 74 61 74 65 5d 2c 20  Arg[p->nState], 
3300: 26 70 2d 3e 61 41 72 67 5b 69 53 74 61 72 74 5d  &p->aArg[iStart]
3310: 2c 20 4e 2a 73 69 7a 65 6f 66 28 70 2d 3e 61 41  , N*sizeof(p->aA
3320: 72 67 5b 30 5d 29 29 3b 0a 20 20 70 2d 3e 6e 53  rg[0]));.  p->nS
3330: 74 61 74 65 20 2b 3d 20 4e 3b 0a 7d 0a 0a 2f 2a  tate += N;.}../*
3340: 20 52 65 74 75 72 6e 20 74 72 75 65 20 69 66 20   Return true if 
3350: 63 20 69 73 20 61 20 68 65 78 61 64 65 63 69 6d  c is a hexadecim
3360: 61 6c 20 64 69 67 69 74 20 63 68 61 72 61 63 74  al digit charact
3370: 65 72 3a 20 20 5b 30 2d 39 61 2d 66 41 2d 46 5d  er:  [0-9a-fA-F]
3380: 0a 2a 2a 20 49 66 20 63 20 69 73 20 61 20 68 65  .** If c is a he
3390: 78 20 64 69 67 69 74 2c 20 61 6c 73 6f 20 73 65  x digit, also se
33a0: 74 20 2a 70 56 20 3d 20 28 2a 70 56 29 2a 31 36  t *pV = (*pV)*16
33b0: 20 2b 20 76 61 6c 75 65 6f 66 28 63 29 2e 20 20   + valueof(c).  
33c0: 49 66 0a 2a 2a 20 63 20 69 73 20 6e 6f 74 20 61  If.** c is not a
33d0: 20 68 65 78 20 64 69 67 69 74 20 2a 70 56 20 69   hex digit *pV i
33e0: 73 20 75 6e 63 68 61 6e 67 65 64 2e 0a 2a 2f 0a  s unchanged..*/.
33f0: 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 68 65  static int re_he
3400: 78 28 69 6e 74 20 63 2c 20 69 6e 74 20 2a 70 56  x(int c, int *pV
3410: 29 7b 0a 20 20 69 66 28 20 63 3e 3d 27 30 27 20  ){.  if( c>='0' 
3420: 26 26 20 63 3c 3d 27 39 27 20 29 7b 0a 20 20 20  && c<='9' ){.   
3430: 20 63 20 2d 3d 20 27 30 27 3b 0a 20 20 7d 65 6c   c -= '0';.  }el
3440: 73 65 20 69 66 28 20 63 3e 3d 27 61 27 20 26 26  se if( c>='a' &&
3450: 20 63 3c 3d 27 66 27 20 29 7b 0a 20 20 20 20 63   c<='f' ){.    c
3460: 20 2d 3d 20 27 61 27 20 2d 20 31 30 3b 0a 20 20   -= 'a' - 10;.  
3470: 7d 65 6c 73 65 20 69 66 28 20 63 3e 3d 27 41 27  }else if( c>='A'
3480: 20 26 26 20 63 3c 3d 27 46 27 20 29 7b 0a 20 20   && c<='F' ){.  
3490: 20 20 63 20 2d 3d 20 27 41 27 20 2d 20 31 30 3b    c -= 'A' - 10;
34a0: 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 72 65  .  }else{.    re
34b0: 74 75 72 6e 20 30 3b 0a 20 20 7d 0a 20 20 2a 70  turn 0;.  }.  *p
34c0: 56 20 3d 20 28 2a 70 56 29 2a 31 36 20 2b 20 28  V = (*pV)*16 + (
34d0: 63 20 26 20 30 78 66 66 29 3b 0a 20 20 72 65 74  c & 0xff);.  ret
34e0: 75 72 6e 20 31 3b 0a 7d 0a 0a 2f 2a 20 41 20 62  urn 1;.}../* A b
34f0: 61 63 6b 73 6c 61 73 68 20 63 68 61 72 61 63 74  ackslash charact
3500: 65 72 20 68 61 73 20 62 65 65 6e 20 73 65 65 6e  er has been seen
3510: 2c 20 72 65 61 64 20 74 68 65 20 6e 65 78 74 20  , read the next 
3520: 63 68 61 72 61 63 74 65 72 20 61 6e 64 0a 2a 2a  character and.**
3530: 20 72 65 74 75 72 6e 20 69 74 73 20 69 6e 74 65   return its inte
3540: 72 70 72 65 74 61 74 69 6f 6e 2e 0a 2a 2f 0a 73  rpretation..*/.s
3550: 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20 72  tatic unsigned r
3560: 65 5f 65 73 63 5f 63 68 61 72 28 52 65 43 6f 6d  e_esc_char(ReCom
3570: 70 69 6c 65 64 20 2a 70 29 7b 0a 20 20 73 74 61  piled *p){.  sta
3580: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 7a  tic const char z
3590: 45 73 63 5b 5d 20 3d 20 22 61 66 6e 72 74 76 5c  Esc[] = "afnrtv\
35a0: 5c 28 29 2a 2e 2b 3f 5b 24 5e 7b 7c 7d 5d 22 3b  \()*.+?[$^{|}]";
35b0: 0a 20 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20  .  static const 
35c0: 63 68 61 72 20 7a 54 72 61 6e 73 5b 5d 20 3d 20  char zTrans[] = 
35d0: 22 5c 61 5c 66 5c 6e 5c 72 5c 74 5c 76 22 3b 0a  "\a\f\n\r\t\v";.
35e0: 20 20 69 6e 74 20 69 2c 20 76 20 3d 20 30 3b 0a    int i, v = 0;.
35f0: 20 20 63 68 61 72 20 63 3b 0a 20 20 69 66 28 20    char c;.  if( 
3600: 70 2d 3e 73 49 6e 2e 69 3e 3d 70 2d 3e 73 49 6e  p->sIn.i>=p->sIn
3610: 2e 6d 78 20 29 20 72 65 74 75 72 6e 20 30 3b 0a  .mx ) return 0;.
3620: 20 20 63 20 3d 20 70 2d 3e 73 49 6e 2e 7a 5b 70    c = p->sIn.z[p
3630: 2d 3e 73 49 6e 2e 69 5d 3b 0a 20 20 69 66 28 20  ->sIn.i];.  if( 
3640: 63 3d 3d 27 75 27 20 26 26 20 70 2d 3e 73 49 6e  c=='u' && p->sIn
3650: 2e 69 2b 34 3c 70 2d 3e 73 49 6e 2e 6d 78 20 29  .i+4<p->sIn.mx )
3660: 7b 0a 20 20 20 20 63 6f 6e 73 74 20 75 6e 73 69  {.    const unsi
3670: 67 6e 65 64 20 63 68 61 72 20 2a 7a 49 6e 20 3d  gned char *zIn =
3680: 20 70 2d 3e 73 49 6e 2e 7a 20 2b 20 70 2d 3e 73   p->sIn.z + p->s
3690: 49 6e 2e 69 3b 0a 20 20 20 20 69 66 28 20 72 65  In.i;.    if( re
36a0: 5f 68 65 78 28 7a 49 6e 5b 31 5d 2c 26 76 29 0a  _hex(zIn[1],&v).
36b0: 20 20 20 20 20 26 26 20 72 65 5f 68 65 78 28 7a       && re_hex(z
36c0: 49 6e 5b 32 5d 2c 26 76 29 0a 20 20 20 20 20 26  In[2],&v).     &
36d0: 26 20 72 65 5f 68 65 78 28 7a 49 6e 5b 33 5d 2c  & re_hex(zIn[3],
36e0: 26 76 29 0a 20 20 20 20 20 26 26 20 72 65 5f 68  &v).     && re_h
36f0: 65 78 28 7a 49 6e 5b 34 5d 2c 26 76 29 0a 20 20  ex(zIn[4],&v).  
3700: 20 20 29 7b 0a 20 20 20 20 20 20 70 2d 3e 73 49    ){.      p->sI
3710: 6e 2e 69 20 2b 3d 20 35 3b 0a 20 20 20 20 20 20  n.i += 5;.      
3720: 72 65 74 75 72 6e 20 76 3b 0a 20 20 20 20 7d 0a  return v;.    }.
3730: 20 20 7d 0a 20 20 69 66 28 20 63 3d 3d 27 78 27    }.  if( c=='x'
3740: 20 26 26 20 70 2d 3e 73 49 6e 2e 69 2b 32 3c 70   && p->sIn.i+2<p
3750: 2d 3e 73 49 6e 2e 6d 78 20 29 7b 0a 20 20 20 20  ->sIn.mx ){.    
3760: 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20 63  const unsigned c
3770: 68 61 72 20 2a 7a 49 6e 20 3d 20 70 2d 3e 73 49  har *zIn = p->sI
3780: 6e 2e 7a 20 2b 20 70 2d 3e 73 49 6e 2e 69 3b 0a  n.z + p->sIn.i;.
3790: 20 20 20 20 69 66 28 20 72 65 5f 68 65 78 28 7a      if( re_hex(z
37a0: 49 6e 5b 31 5d 2c 26 76 29 0a 20 20 20 20 20 26  In[1],&v).     &
37b0: 26 20 72 65 5f 68 65 78 28 7a 49 6e 5b 32 5d 2c  & re_hex(zIn[2],
37c0: 26 76 29 0a 20 20 20 20 29 7b 0a 20 20 20 20 20  &v).    ){.     
37d0: 20 70 2d 3e 73 49 6e 2e 69 20 2b 3d 20 33 3b 0a   p->sIn.i += 3;.
37e0: 20 20 20 20 20 20 72 65 74 75 72 6e 20 76 3b 0a        return v;.
37f0: 20 20 20 20 7d 0a 20 20 7d 0a 20 20 66 6f 72 28      }.  }.  for(
3800: 69 3d 30 3b 20 7a 45 73 63 5b 69 5d 20 26 26 20  i=0; zEsc[i] && 
3810: 7a 45 73 63 5b 69 5d 21 3d 63 3b 20 69 2b 2b 29  zEsc[i]!=c; i++)
3820: 7b 7d 0a 20 20 69 66 28 20 7a 45 73 63 5b 69 5d  {}.  if( zEsc[i]
3830: 20 29 7b 0a 20 20 20 20 69 66 28 20 69 3c 36 20   ){.    if( i<6 
3840: 29 20 63 20 3d 20 7a 54 72 61 6e 73 5b 69 5d 3b  ) c = zTrans[i];
3850: 0a 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b  .    p->sIn.i++;
3860: 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 70 2d  .  }else{.    p-
3870: 3e 7a 45 72 72 20 3d 20 22 75 6e 6b 6e 6f 77 6e  >zErr = "unknown
3880: 20 5c 5c 20 65 73 63 61 70 65 22 3b 0a 20 20 7d   \\ escape";.  }
3890: 0a 20 20 72 65 74 75 72 6e 20 63 3b 0a 7d 0a 0a  .  return c;.}..
38a0: 2f 2a 20 46 6f 72 77 61 72 64 20 64 65 63 6c 61  /* Forward decla
38b0: 72 61 74 69 6f 6e 20 2a 2f 0a 73 74 61 74 69 63  ration */.static
38c0: 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 72 65 5f   const char *re_
38d0: 73 75 62 63 6f 6d 70 69 6c 65 5f 73 74 72 69 6e  subcompile_strin
38e0: 67 28 52 65 43 6f 6d 70 69 6c 65 64 2a 29 3b 0a  g(ReCompiled*);.
38f0: 0a 2f 2a 20 50 65 65 6b 20 61 74 20 74 68 65 20  ./* Peek at the 
3900: 6e 65 78 74 20 62 79 74 65 20 6f 66 20 69 6e 70  next byte of inp
3910: 75 74 20 2a 2f 0a 73 74 61 74 69 63 20 75 6e 73  ut */.static uns
3920: 69 67 6e 65 64 20 63 68 61 72 20 72 65 50 65 65  igned char rePee
3930: 6b 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 29  k(ReCompiled *p)
3940: 7b 0a 20 20 72 65 74 75 72 6e 20 70 2d 3e 73 49  {.  return p->sI
3950: 6e 2e 69 3c 70 2d 3e 73 49 6e 2e 6d 78 20 3f 20  n.i<p->sIn.mx ? 
3960: 70 2d 3e 73 49 6e 2e 7a 5b 70 2d 3e 73 49 6e 2e  p->sIn.z[p->sIn.
3970: 69 5d 20 3a 20 30 3b 0a 7d 0a 0a 2f 2a 20 43 6f  i] : 0;.}../* Co
3980: 6d 70 69 6c 65 20 52 45 20 74 65 78 74 20 69 6e  mpile RE text in
3990: 74 6f 20 61 20 73 65 71 75 65 6e 63 65 20 6f 66  to a sequence of
39a0: 20 6f 70 63 6f 64 65 73 2e 20 20 43 6f 6e 74 69   opcodes.  Conti
39b0: 6e 75 65 20 75 70 20 74 6f 20 74 68 65 0a 2a 2a  nue up to the.**
39c0: 20 66 69 72 73 74 20 75 6e 6d 61 74 63 68 65 64   first unmatched
39d0: 20 22 29 22 20 63 68 61 72 61 63 74 65 72 2c 20   ")" character, 
39e0: 74 68 65 6e 20 72 65 74 75 72 6e 2e 20 20 49 66  then return.  If
39f0: 20 61 6e 20 65 72 72 6f 72 20 69 73 20 66 6f 75   an error is fou
3a00: 6e 64 2c 0a 2a 2a 20 72 65 74 75 72 6e 20 61 20  nd,.** return a 
3a10: 70 6f 69 6e 74 65 72 20 74 6f 20 74 68 65 20 65  pointer to the e
3a20: 72 72 6f 72 20 6d 65 73 73 61 67 65 20 73 74 72  rror message str
3a30: 69 6e 67 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 63  ing..*/.static c
3a40: 6f 6e 73 74 20 63 68 61 72 20 2a 72 65 5f 73 75  onst char *re_su
3a50: 62 63 6f 6d 70 69 6c 65 5f 72 65 28 52 65 43 6f  bcompile_re(ReCo
3a60: 6d 70 69 6c 65 64 20 2a 70 29 7b 0a 20 20 63 6f  mpiled *p){.  co
3a70: 6e 73 74 20 63 68 61 72 20 2a 7a 45 72 72 3b 0a  nst char *zErr;.
3a80: 20 20 69 6e 74 20 69 53 74 61 72 74 2c 20 69 45    int iStart, iE
3a90: 6e 64 2c 20 69 47 6f 74 6f 3b 0a 20 20 69 53 74  nd, iGoto;.  iSt
3aa0: 61 72 74 20 3d 20 70 2d 3e 6e 53 74 61 74 65 3b  art = p->nState;
3ab0: 0a 20 20 7a 45 72 72 20 3d 20 72 65 5f 73 75 62  .  zErr = re_sub
3ac0: 63 6f 6d 70 69 6c 65 5f 73 74 72 69 6e 67 28 70  compile_string(p
3ad0: 29 3b 0a 20 20 69 66 28 20 7a 45 72 72 20 29 20  );.  if( zErr ) 
3ae0: 72 65 74 75 72 6e 20 7a 45 72 72 3b 0a 20 20 77  return zErr;.  w
3af0: 68 69 6c 65 28 20 72 65 50 65 65 6b 28 70 29 3d  hile( rePeek(p)=
3b00: 3d 27 7c 27 20 29 7b 0a 20 20 20 20 69 45 6e 64  ='|' ){.    iEnd
3b10: 20 3d 20 70 2d 3e 6e 53 74 61 74 65 3b 0a 20 20   = p->nState;.  
3b20: 20 20 72 65 5f 69 6e 73 65 72 74 28 70 2c 20 69    re_insert(p, i
3b30: 53 74 61 72 74 2c 20 52 45 5f 4f 50 5f 46 4f 52  Start, RE_OP_FOR
3b40: 4b 2c 20 69 45 6e 64 20 2b 20 32 20 2d 20 69 53  K, iEnd + 2 - iS
3b50: 74 61 72 74 29 3b 0a 20 20 20 20 69 47 6f 74 6f  tart);.    iGoto
3b60: 20 3d 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20   = re_append(p, 
3b70: 52 45 5f 4f 50 5f 47 4f 54 4f 2c 20 30 29 3b 0a  RE_OP_GOTO, 0);.
3b80: 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a      p->sIn.i++;.
3b90: 20 20 20 20 7a 45 72 72 20 3d 20 72 65 5f 73 75      zErr = re_su
3ba0: 62 63 6f 6d 70 69 6c 65 5f 73 74 72 69 6e 67 28  bcompile_string(
3bb0: 70 29 3b 0a 20 20 20 20 69 66 28 20 7a 45 72 72  p);.    if( zErr
3bc0: 20 29 20 72 65 74 75 72 6e 20 7a 45 72 72 3b 0a   ) return zErr;.
3bd0: 20 20 20 20 70 2d 3e 61 41 72 67 5b 69 47 6f 74      p->aArg[iGot
3be0: 6f 5d 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20 2d  o] = p->nState -
3bf0: 20 69 47 6f 74 6f 3b 0a 20 20 7d 0a 20 20 72 65   iGoto;.  }.  re
3c00: 74 75 72 6e 20 30 3b 0a 7d 0a 0a 2f 2a 20 43 6f  turn 0;.}../* Co
3c10: 6d 70 69 6c 65 20 61 6e 20 65 6c 65 6d 65 6e 74  mpile an element
3c20: 20 6f 66 20 72 65 67 75 6c 61 72 20 65 78 70 72   of regular expr
3c30: 65 73 73 69 6f 6e 20 74 65 78 74 20 28 61 6e 79  ession text (any
3c40: 74 68 69 6e 67 20 74 68 61 74 20 63 61 6e 20 62  thing that can b
3c50: 65 0a 2a 2a 20 61 6e 20 6f 70 65 72 61 6e 64 20  e.** an operand 
3c60: 74 6f 20 74 68 65 20 22 7c 22 20 6f 70 65 72 61  to the "|" opera
3c70: 74 6f 72 29 2e 20 20 52 65 74 75 72 6e 20 4e 55  tor).  Return NU
3c80: 4c 4c 20 6f 6e 20 73 75 63 63 65 73 73 20 6f 72  LL on success or
3c90: 20 61 20 70 6f 69 6e 74 65 72 0a 2a 2a 20 74 6f   a pointer.** to
3ca0: 20 74 68 65 20 65 72 72 6f 72 20 6d 65 73 73 61   the error messa
3cb0: 67 65 20 69 66 20 74 68 65 72 65 20 69 73 20 61  ge if there is a
3cc0: 20 70 72 6f 62 6c 65 6d 2e 0a 2a 2f 0a 73 74 61   problem..*/.sta
3cd0: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a  tic const char *
3ce0: 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 73 74  re_subcompile_st
3cf0: 72 69 6e 67 28 52 65 43 6f 6d 70 69 6c 65 64 20  ring(ReCompiled 
3d00: 2a 70 29 7b 0a 20 20 69 6e 74 20 69 50 72 65 76  *p){.  int iPrev
3d10: 20 3d 20 2d 31 3b 0a 20 20 69 6e 74 20 69 53 74   = -1;.  int iSt
3d20: 61 72 74 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20  art;.  unsigned 
3d30: 63 3b 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20  c;.  const char 
3d40: 2a 7a 45 72 72 3b 0a 20 20 77 68 69 6c 65 28 20  *zErr;.  while( 
3d50: 28 63 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61  (c = p->xNextCha
3d60: 72 28 26 70 2d 3e 73 49 6e 29 29 21 3d 30 20 29  r(&p->sIn))!=0 )
3d70: 7b 0a 20 20 20 20 69 53 74 61 72 74 20 3d 20 70  {.    iStart = p
3d80: 2d 3e 6e 53 74 61 74 65 3b 0a 20 20 20 20 73 77  ->nState;.    sw
3d90: 69 74 63 68 28 20 63 20 29 7b 0a 20 20 20 20 20  itch( c ){.     
3da0: 20 63 61 73 65 20 27 7c 27 3a 0a 20 20 20 20 20   case '|':.     
3db0: 20 63 61 73 65 20 27 24 27 3a 20 0a 20 20 20 20   case '$': .    
3dc0: 20 20 63 61 73 65 20 27 29 27 3a 20 7b 0a 20 20    case ')': {.  
3dd0: 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2d 2d        p->sIn.i--
3de0: 3b 0a 20 20 20 20 20 20 20 20 72 65 74 75 72 6e  ;.        return
3df0: 20 30 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20   0;.      }.    
3e00: 20 20 63 61 73 65 20 27 28 27 3a 20 7b 0a 20 20    case '(': {.  
3e10: 20 20 20 20 20 20 7a 45 72 72 20 3d 20 72 65 5f        zErr = re_
3e20: 73 75 62 63 6f 6d 70 69 6c 65 5f 72 65 28 70 29  subcompile_re(p)
3e30: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 7a 45  ;.        if( zE
3e40: 72 72 20 29 20 72 65 74 75 72 6e 20 7a 45 72 72  rr ) return zErr
3e50: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 72 65  ;.        if( re
3e60: 50 65 65 6b 28 70 29 21 3d 27 29 27 20 29 20 72  Peek(p)!=')' ) r
3e70: 65 74 75 72 6e 20 22 75 6e 6d 61 74 63 68 65 64  eturn "unmatched
3e80: 20 27 28 27 22 3b 0a 20 20 20 20 20 20 20 20 70   '('";.        p
3e90: 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20  ->sIn.i++;.     
3ea0: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20     break;.      
3eb0: 7d 0a 20 20 20 20 20 20 63 61 73 65 20 27 2e 27  }.      case '.'
3ec0: 3a 20 7b 0a 20 20 20 20 20 20 20 20 69 66 28 20  : {.        if( 
3ed0: 72 65 50 65 65 6b 28 70 29 3d 3d 27 2a 27 20 29  rePeek(p)=='*' )
3ee0: 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61  {.          re_a
3ef0: 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 41  ppend(p, RE_OP_A
3f00: 4e 59 53 54 41 52 2c 20 30 29 3b 0a 20 20 20 20  NYSTAR, 0);.    
3f10: 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b        p->sIn.i++
3f20: 3b 0a 20 20 20 20 20 20 20 20 7d 65 6c 73 65 7b  ;.        }else{
3f30: 20 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61   .          re_a
3f40: 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 41  ppend(p, RE_OP_A
3f50: 4e 59 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20  NY, 0);.        
3f60: 7d 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b  }.        break;
3f70: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63  .      }.      c
3f80: 61 73 65 20 27 2a 27 3a 20 7b 0a 20 20 20 20 20  ase '*': {.     
3f90: 20 20 20 69 66 28 20 69 50 72 65 76 3c 30 20 29     if( iPrev<0 )
3fa0: 20 72 65 74 75 72 6e 20 22 27 2a 27 20 77 69 74   return "'*' wit
3fb0: 68 6f 75 74 20 6f 70 65 72 61 6e 64 22 3b 0a 20  hout operand";. 
3fc0: 20 20 20 20 20 20 20 72 65 5f 69 6e 73 65 72 74         re_insert
3fd0: 28 70 2c 20 69 50 72 65 76 2c 20 52 45 5f 4f 50  (p, iPrev, RE_OP
3fe0: 5f 47 4f 54 4f 2c 20 70 2d 3e 6e 53 74 61 74 65  _GOTO, p->nState
3ff0: 20 2d 20 69 50 72 65 76 20 2b 20 31 29 3b 0a 20   - iPrev + 1);. 
4000: 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64         re_append
4010: 28 70 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20  (p, RE_OP_FORK, 
4020: 69 50 72 65 76 20 2d 20 70 2d 3e 6e 53 74 61 74  iPrev - p->nStat
4030: 65 20 2b 20 31 29 3b 0a 20 20 20 20 20 20 20 20  e + 1);.        
4040: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20  break;.      }. 
4050: 20 20 20 20 20 63 61 73 65 20 27 2b 27 3a 20 7b       case '+': {
4060: 0a 20 20 20 20 20 20 20 20 69 66 28 20 69 50 72  .        if( iPr
4070: 65 76 3c 30 20 29 20 72 65 74 75 72 6e 20 22 27  ev<0 ) return "'
4080: 2b 27 20 77 69 74 68 6f 75 74 20 6f 70 65 72 61  +' without opera
4090: 6e 64 22 3b 0a 20 20 20 20 20 20 20 20 72 65 5f  nd";.        re_
40a0: 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f  append(p, RE_OP_
40b0: 46 4f 52 4b 2c 20 69 50 72 65 76 20 2d 20 70 2d  FORK, iPrev - p-
40c0: 3e 6e 53 74 61 74 65 29 3b 0a 20 20 20 20 20 20  >nState);.      
40d0: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d    break;.      }
40e0: 0a 20 20 20 20 20 20 63 61 73 65 20 27 3f 27 3a  .      case '?':
40f0: 20 7b 0a 20 20 20 20 20 20 20 20 69 66 28 20 69   {.        if( i
4100: 50 72 65 76 3c 30 20 29 20 72 65 74 75 72 6e 20  Prev<0 ) return 
4110: 22 27 3f 27 20 77 69 74 68 6f 75 74 20 6f 70 65  "'?' without ope
4120: 72 61 6e 64 22 3b 0a 20 20 20 20 20 20 20 20 72  rand";.        r
4130: 65 5f 69 6e 73 65 72 74 28 70 2c 20 69 50 72 65  e_insert(p, iPre
4140: 76 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20 70  v, RE_OP_FORK, p
4150: 2d 3e 6e 53 74 61 74 65 20 2d 20 69 50 72 65 76  ->nState - iPrev
4160: 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 62 72 65  +1);.        bre
4170: 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20  ak;.      }.    
4180: 20 20 63 61 73 65 20 27 7b 27 3a 20 7b 0a 20 20    case '{': {.  
4190: 20 20 20 20 20 20 69 6e 74 20 6d 20 3d 20 30 2c        int m = 0,
41a0: 20 6e 20 3d 20 30 3b 0a 20 20 20 20 20 20 20 20   n = 0;.        
41b0: 69 6e 74 20 73 7a 2c 20 6a 3b 0a 20 20 20 20 20  int sz, j;.     
41c0: 20 20 20 69 66 28 20 69 50 72 65 76 3c 30 20 29     if( iPrev<0 )
41d0: 20 72 65 74 75 72 6e 20 22 27 7b 6d 2c 6e 7d 27   return "'{m,n}'
41e0: 20 77 69 74 68 6f 75 74 20 6f 70 65 72 61 6e 64   without operand
41f0: 22 3b 0a 20 20 20 20 20 20 20 20 77 68 69 6c 65  ";.        while
4200: 28 20 28 63 3d 72 65 50 65 65 6b 28 70 29 29 3e  ( (c=rePeek(p))>
4210: 3d 27 30 27 20 26 26 20 63 3c 3d 27 39 27 20 29  ='0' && c<='9' )
4220: 7b 20 6d 20 3d 20 6d 2a 31 30 20 2b 20 63 20 2d  { m = m*10 + c -
4230: 20 27 30 27 3b 20 70 2d 3e 73 49 6e 2e 69 2b 2b   '0'; p->sIn.i++
4240: 3b 20 7d 0a 20 20 20 20 20 20 20 20 6e 20 3d 20  ; }.        n = 
4250: 6d 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 63  m;.        if( c
4260: 3d 3d 27 2c 27 20 29 7b 0a 20 20 20 20 20 20 20  ==',' ){.       
4270: 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20     p->sIn.i++;. 
4280: 20 20 20 20 20 20 20 20 20 6e 20 3d 20 30 3b 0a           n = 0;.
4290: 20 20 20 20 20 20 20 20 20 20 77 68 69 6c 65 28            while(
42a0: 20 28 63 3d 72 65 50 65 65 6b 28 70 29 29 3e 3d   (c=rePeek(p))>=
42b0: 27 30 27 20 26 26 20 63 3c 3d 27 39 27 20 29 7b  '0' && c<='9' ){
42c0: 20 6e 20 3d 20 6e 2a 31 30 20 2b 20 63 2d 27 30   n = n*10 + c-'0
42d0: 27 3b 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 20 7d  '; p->sIn.i++; }
42e0: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20  .        }.     
42f0: 20 20 20 69 66 28 20 63 21 3d 27 7d 27 20 29 20     if( c!='}' ) 
4300: 72 65 74 75 72 6e 20 22 75 6e 6d 61 74 63 68 65  return "unmatche
4310: 64 20 27 7b 27 22 3b 0a 20 20 20 20 20 20 20 20  d '{'";.        
4320: 69 66 28 20 6e 3e 30 20 26 26 20 6e 3c 6d 20 29  if( n>0 && n<m )
4330: 20 72 65 74 75 72 6e 20 22 6e 20 6c 65 73 73 20   return "n less 
4340: 74 68 61 6e 20 6d 20 69 6e 20 27 7b 6d 2c 6e 7d  than m in '{m,n}
4350: 27 22 3b 0a 20 20 20 20 20 20 20 20 70 2d 3e 73  '";.        p->s
4360: 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20 20 20 20  In.i++;.        
4370: 73 7a 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20 2d  sz = p->nState -
4380: 20 69 50 72 65 76 3b 0a 20 20 20 20 20 20 20 20   iPrev;.        
4390: 69 66 28 20 6d 3d 3d 30 20 29 7b 0a 20 20 20 20  if( m==0 ){.    
43a0: 20 20 20 20 20 20 69 66 28 20 6e 3d 3d 30 20 29        if( n==0 )
43b0: 20 72 65 74 75 72 6e 20 22 62 6f 74 68 20 6d 20   return "both m 
43c0: 61 6e 64 20 6e 20 61 72 65 20 7a 65 72 6f 20 69  and n are zero i
43d0: 6e 20 27 7b 6d 2c 6e 7d 27 22 3b 0a 20 20 20 20  n '{m,n}'";.    
43e0: 20 20 20 20 20 20 72 65 5f 69 6e 73 65 72 74 28        re_insert(
43f0: 70 2c 20 69 50 72 65 76 2c 20 52 45 5f 4f 50 5f  p, iPrev, RE_OP_
4400: 46 4f 52 4b 2c 20 73 7a 2b 31 29 3b 0a 20 20 20  FORK, sz+1);.   
4410: 20 20 20 20 20 20 20 6e 2d 2d 3b 0a 20 20 20 20         n--;.    
4420: 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20      }else{.     
4430: 20 20 20 20 20 66 6f 72 28 6a 3d 31 3b 20 6a 3c       for(j=1; j<
4440: 6d 3b 20 6a 2b 2b 29 20 72 65 5f 63 6f 70 79 28  m; j++) re_copy(
4450: 70 2c 20 69 50 72 65 76 2c 20 73 7a 29 3b 0a 20  p, iPrev, sz);. 
4460: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
4470: 20 66 6f 72 28 6a 3d 6d 3b 20 6a 3c 6e 3b 20 6a   for(j=m; j<n; j
4480: 2b 2b 29 7b 0a 20 20 20 20 20 20 20 20 20 20 72  ++){.          r
4490: 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f  e_append(p, RE_O
44a0: 50 5f 46 4f 52 4b 2c 20 73 7a 2b 31 29 3b 0a 20  P_FORK, sz+1);. 
44b0: 20 20 20 20 20 20 20 20 20 72 65 5f 63 6f 70 79           re_copy
44c0: 28 70 2c 20 69 50 72 65 76 2c 20 73 7a 29 3b 0a  (p, iPrev, sz);.
44d0: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
44e0: 20 20 69 66 28 20 6e 3d 3d 30 20 26 26 20 6d 3e    if( n==0 && m>
44f0: 30 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 72  0 ){.          r
4500: 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f  e_append(p, RE_O
4510: 50 5f 46 4f 52 4b 2c 20 2d 73 7a 29 3b 0a 20 20  P_FORK, -sz);.  
4520: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
4530: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20  break;.      }. 
4540: 20 20 20 20 20 63 61 73 65 20 27 5b 27 3a 20 7b       case '[': {
4550: 0a 20 20 20 20 20 20 20 20 69 6e 74 20 69 46 69  .        int iFi
4560: 72 73 74 20 3d 20 70 2d 3e 6e 53 74 61 74 65 3b  rst = p->nState;
4570: 0a 20 20 20 20 20 20 20 20 69 66 28 20 72 65 50  .        if( reP
4580: 65 65 6b 28 70 29 3d 3d 27 5e 27 20 29 7b 0a 20  eek(p)=='^' ){. 
4590: 20 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65           re_appe
45a0: 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f 45  nd(p, RE_OP_CC_E
45b0: 58 43 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20  XC, 0);.        
45c0: 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20    p->sIn.i++;.  
45d0: 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20        }else{.   
45e0: 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64         re_append
45f0: 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f 49 4e 43  (p, RE_OP_CC_INC
4600: 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20 7d 0a  , 0);.        }.
4610: 20 20 20 20 20 20 20 20 77 68 69 6c 65 28 20 28          while( (
4620: 63 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61 72  c = p->xNextChar
4630: 28 26 70 2d 3e 73 49 6e 29 29 21 3d 30 20 29 7b  (&p->sIn))!=0 ){
4640: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 63  .          if( c
4650: 3d 3d 27 5b 27 20 26 26 20 72 65 50 65 65 6b 28  =='[' && rePeek(
4660: 70 29 3d 3d 27 3a 27 20 29 7b 0a 20 20 20 20 20  p)==':' ){.     
4670: 20 20 20 20 20 20 20 72 65 74 75 72 6e 20 22 50         return "P
4680: 4f 53 49 58 20 63 68 61 72 61 63 74 65 72 20 63  OSIX character c
4690: 6c 61 73 73 65 73 20 6e 6f 74 20 73 75 70 70 6f  lasses not suppo
46a0: 72 74 65 64 22 3b 0a 20 20 20 20 20 20 20 20 20  rted";.         
46b0: 20 7d 0a 20 20 20 20 20 20 20 20 20 20 69 66 28   }.          if(
46c0: 20 63 3d 3d 27 5c 5c 27 20 29 20 63 20 3d 20 72   c=='\\' ) c = r
46d0: 65 5f 65 73 63 5f 63 68 61 72 28 70 29 3b 0a 20  e_esc_char(p);. 
46e0: 20 20 20 20 20 20 20 20 20 69 66 28 20 72 65 50           if( reP
46f0: 65 65 6b 28 70 29 3d 3d 27 2d 27 20 29 7b 0a 20  eek(p)=='-' ){. 
4700: 20 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 70             re_ap
4710: 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43  pend(p, RE_OP_CC
4720: 5f 52 41 4e 47 45 2c 20 63 29 3b 0a 20 20 20 20  _RANGE, c);.    
4730: 20 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69          p->sIn.i
4740: 2b 2b 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20  ++;.            
4750: 63 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61 72  c = p->xNextChar
4760: 28 26 70 2d 3e 73 49 6e 29 3b 0a 20 20 20 20 20  (&p->sIn);.     
4770: 20 20 20 20 20 20 20 69 66 28 20 63 3d 3d 27 5c         if( c=='\
4780: 5c 27 20 29 20 63 20 3d 20 72 65 5f 65 73 63 5f  \' ) c = re_esc_
4790: 63 68 61 72 28 70 29 3b 0a 20 20 20 20 20 20 20  char(p);.       
47a0: 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70       re_append(p
47b0: 2c 20 52 45 5f 4f 50 5f 43 43 5f 52 41 4e 47 45  , RE_OP_CC_RANGE
47c0: 2c 20 63 29 3b 0a 20 20 20 20 20 20 20 20 20 20  , c);.          
47d0: 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20  }else{.         
47e0: 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20     re_append(p, 
47f0: 52 45 5f 4f 50 5f 43 43 5f 56 41 4c 55 45 2c 20  RE_OP_CC_VALUE, 
4800: 63 29 3b 0a 20 20 20 20 20 20 20 20 20 20 7d 0a  c);.          }.
4810: 20 20 20 20 20 20 20 20 20 20 69 66 28 20 72 65            if( re
4820: 50 65 65 6b 28 70 29 3d 3d 27 5d 27 20 29 7b 20  Peek(p)==']' ){ 
4830: 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 20 62 72 65 61  p->sIn.i++; brea
4840: 6b 3b 20 7d 0a 20 20 20 20 20 20 20 20 7d 0a 20  k; }.        }. 
4850: 20 20 20 20 20 20 20 69 66 28 20 63 3d 3d 30 20         if( c==0 
4860: 29 20 72 65 74 75 72 6e 20 22 75 6e 63 6c 6f 73  ) return "unclos
4870: 65 64 20 27 5b 27 22 3b 0a 20 20 20 20 20 20 20  ed '['";.       
4880: 20 70 2d 3e 61 41 72 67 5b 69 46 69 72 73 74 5d   p->aArg[iFirst]
4890: 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20 2d 20 69   = p->nState - i
48a0: 46 69 72 73 74 3b 0a 20 20 20 20 20 20 20 20 62  First;.        b
48b0: 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20  reak;.      }.  
48c0: 20 20 20 20 63 61 73 65 20 27 5c 5c 27 3a 20 7b      case '\\': {
48d0: 0a 20 20 20 20 20 20 20 20 69 6e 74 20 73 70 65  .        int spe
48e0: 63 69 61 6c 4f 70 20 3d 20 30 3b 0a 20 20 20 20  cialOp = 0;.    
48f0: 20 20 20 20 73 77 69 74 63 68 28 20 72 65 50 65      switch( rePe
4900: 65 6b 28 70 29 20 29 7b 0a 20 20 20 20 20 20 20  ek(p) ){.       
4910: 20 20 20 63 61 73 65 20 27 62 27 3a 20 73 70 65     case 'b': spe
4920: 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f 42  cialOp = RE_OP_B
4930: 4f 55 4e 44 41 52 59 3b 20 20 20 62 72 65 61 6b  OUNDARY;   break
4940: 3b 0a 20 20 20 20 20 20 20 20 20 20 63 61 73 65  ;.          case
4950: 20 27 64 27 3a 20 73 70 65 63 69 61 6c 4f 70 20   'd': specialOp 
4960: 3d 20 52 45 5f 4f 50 5f 44 49 47 49 54 3b 20 20  = RE_OP_DIGIT;  
4970: 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20      break;.     
4980: 20 20 20 20 20 63 61 73 65 20 27 44 27 3a 20 73       case 'D': s
4990: 70 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f 50  pecialOp = RE_OP
49a0: 5f 4e 4f 54 44 49 47 49 54 3b 20 20 20 62 72 65  _NOTDIGIT;   bre
49b0: 61 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 63 61  ak;.          ca
49c0: 73 65 20 27 73 27 3a 20 73 70 65 63 69 61 6c 4f  se 's': specialO
49d0: 70 20 3d 20 52 45 5f 4f 50 5f 53 50 41 43 45 3b  p = RE_OP_SPACE;
49e0: 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20        break;.   
49f0: 20 20 20 20 20 20 20 63 61 73 65 20 27 53 27 3a         case 'S':
4a00: 20 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f   specialOp = RE_
4a10: 4f 50 5f 4e 4f 54 53 50 41 43 45 3b 20 20 20 62  OP_NOTSPACE;   b
4a20: 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 20 20  reak;.          
4a30: 63 61 73 65 20 27 77 27 3a 20 73 70 65 63 69 61  case 'w': specia
4a40: 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f 57 4f 52 44  lOp = RE_OP_WORD
4a50: 3b 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20  ;       break;. 
4a60: 20 20 20 20 20 20 20 20 20 63 61 73 65 20 27 57           case 'W
4a70: 27 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20 52  ': specialOp = R
4a80: 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 3b 20 20 20  E_OP_NOTWORD;   
4a90: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20   break;.        
4aa0: 7d 0a 20 20 20 20 20 20 20 20 69 66 28 20 73 70  }.        if( sp
4ab0: 65 63 69 61 6c 4f 70 20 29 7b 0a 20 20 20 20 20  ecialOp ){.     
4ac0: 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b       p->sIn.i++;
4ad0: 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 70  .          re_ap
4ae0: 70 65 6e 64 28 70 2c 20 73 70 65 63 69 61 6c 4f  pend(p, specialO
4af0: 70 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20 7d  p, 0);.        }
4b00: 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20 20  else{.          
4b10: 63 20 3d 20 72 65 5f 65 73 63 5f 63 68 61 72 28  c = re_esc_char(
4b20: 70 29 3b 0a 20 20 20 20 20 20 20 20 20 20 72 65  p);.          re
4b30: 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50  _append(p, RE_OP
4b40: 5f 4d 41 54 43 48 2c 20 63 29 3b 0a 20 20 20 20  _MATCH, c);.    
4b50: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62 72      }.        br
4b60: 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20  eak;.      }.   
4b70: 20 20 20 64 65 66 61 75 6c 74 3a 20 7b 0a 20 20     default: {.  
4b80: 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28        re_append(
4b90: 70 2c 20 52 45 5f 4f 50 5f 4d 41 54 43 48 2c 20  p, RE_OP_MATCH, 
4ba0: 63 29 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61  c);.        brea
4bb0: 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 7d  k;.      }.    }
4bc0: 0a 20 20 20 20 69 50 72 65 76 20 3d 20 69 53 74  .    iPrev = iSt
4bd0: 61 72 74 3b 0a 20 20 7d 0a 20 20 72 65 74 75 72  art;.  }.  retur
4be0: 6e 20 30 3b 0a 7d 0a 0a 2f 2a 20 46 72 65 65 20  n 0;.}../* Free 
4bf0: 61 6e 64 20 72 65 63 6c 61 69 6d 20 61 6c 6c 20  and reclaim all 
4c00: 74 68 65 20 6d 65 6d 6f 72 79 20 75 73 65 64 20  the memory used 
4c10: 62 79 20 61 20 70 72 65 76 69 6f 75 73 6c 79 20  by a previously 
4c20: 63 6f 6d 70 69 6c 65 64 0a 2a 2a 20 72 65 67 75  compiled.** regu
4c30: 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 2e 20  lar expression. 
4c40: 20 41 70 70 6c 69 63 61 74 69 6f 6e 73 20 73 68   Applications sh
4c50: 6f 75 6c 64 20 69 6e 76 6f 6b 65 20 74 68 69 73  ould invoke this
4c60: 20 72 6f 75 74 69 6e 65 20 6f 6e 63 65 0a 2a 2a   routine once.**
4c70: 20 66 6f 72 20 65 76 65 72 79 20 63 61 6c 6c 20   for every call 
4c80: 74 6f 20 72 65 5f 63 6f 6d 70 69 6c 65 28 29 20  to re_compile() 
4c90: 74 6f 20 61 76 6f 69 64 20 6d 65 6d 6f 72 79 20  to avoid memory 
4ca0: 6c 65 61 6b 73 2e 0a 2a 2f 0a 76 6f 69 64 20 72  leaks..*/.void r
4cb0: 65 5f 66 72 65 65 28 52 65 43 6f 6d 70 69 6c 65  e_free(ReCompile
4cc0: 64 20 2a 70 52 65 29 7b 0a 20 20 69 66 28 20 70  d *pRe){.  if( p
4cd0: 52 65 20 29 7b 0a 20 20 20 20 73 71 6c 69 74 65  Re ){.    sqlite
4ce0: 33 5f 66 72 65 65 28 70 52 65 2d 3e 61 4f 70 29  3_free(pRe->aOp)
4cf0: 3b 0a 20 20 20 20 73 71 6c 69 74 65 33 5f 66 72  ;.    sqlite3_fr
4d00: 65 65 28 70 52 65 2d 3e 61 41 72 67 29 3b 0a 20  ee(pRe->aArg);. 
4d10: 20 20 20 73 71 6c 69 74 65 33 5f 66 72 65 65 28     sqlite3_free(
4d20: 70 52 65 29 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a  pRe);.  }.}../*.
4d30: 2a 2a 20 43 6f 6d 70 69 6c 65 20 61 20 74 65 78  ** Compile a tex
4d40: 74 75 61 6c 20 72 65 67 75 6c 61 72 20 65 78 70  tual regular exp
4d50: 72 65 73 73 69 6f 6e 20 69 6e 20 7a 49 6e 5b 5d  ression in zIn[]
4d60: 20 69 6e 74 6f 20 61 20 63 6f 6d 70 69 6c 65 64   into a compiled
4d70: 20 72 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70 72   regular.** expr
4d80: 65 73 73 69 6f 6e 20 73 75 69 74 61 62 6c 65 20  ession suitable 
4d90: 66 6f 72 20 75 73 20 62 79 20 72 65 5f 6d 61 74  for us by re_mat
4da0: 63 68 28 29 20 61 6e 64 20 72 65 74 75 72 6e 20  ch() and return 
4db0: 61 20 70 6f 69 6e 74 65 72 20 74 6f 20 74 68 65  a pointer to the
4dc0: 0a 2a 2a 20 63 6f 6d 70 69 6c 65 64 20 72 65 67  .** compiled reg
4dd0: 75 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20  ular expression 
4de0: 69 6e 20 2a 70 70 52 65 2e 20 20 52 65 74 75 72  in *ppRe.  Retur
4df0: 6e 20 4e 55 4c 4c 20 6f 6e 20 73 75 63 63 65 73  n NULL on succes
4e00: 73 20 6f 72 20 61 6e 0a 2a 2a 20 65 72 72 6f 72  s or an.** error
4e10: 20 6d 65 73 73 61 67 65 20 69 66 20 73 6f 6d 65   message if some
4e20: 74 68 69 6e 67 20 67 6f 65 73 20 77 72 6f 6e 67  thing goes wrong
4e30: 2e 0a 2a 2f 0a 63 6f 6e 73 74 20 63 68 61 72 20  ..*/.const char 
4e40: 2a 72 65 5f 63 6f 6d 70 69 6c 65 28 52 65 43 6f  *re_compile(ReCo
4e50: 6d 70 69 6c 65 64 20 2a 2a 70 70 52 65 2c 20 63  mpiled **ppRe, c
4e60: 6f 6e 73 74 20 63 68 61 72 20 2a 7a 49 6e 2c 20  onst char *zIn, 
4e70: 69 6e 74 20 6e 6f 43 61 73 65 29 7b 0a 20 20 52  int noCase){.  R
4e80: 65 43 6f 6d 70 69 6c 65 64 20 2a 70 52 65 3b 0a  eCompiled *pRe;.
4e90: 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 45    const char *zE
4ea0: 72 72 3b 0a 20 20 69 6e 74 20 69 2c 20 6a 3b 0a  rr;.  int i, j;.
4eb0: 0a 20 20 2a 70 70 52 65 20 3d 20 30 3b 0a 20 20  .  *ppRe = 0;.  
4ec0: 70 52 65 20 3d 20 73 71 6c 69 74 65 33 5f 6d 61  pRe = sqlite3_ma
4ed0: 6c 6c 6f 63 28 20 73 69 7a 65 6f 66 28 2a 70 52  lloc( sizeof(*pR
4ee0: 65 29 20 29 3b 0a 20 20 69 66 28 20 70 52 65 3d  e) );.  if( pRe=
4ef0: 3d 30 20 29 7b 0a 20 20 20 20 72 65 74 75 72 6e  =0 ){.    return
4f00: 20 22 6f 75 74 20 6f 66 20 6d 65 6d 6f 72 79 22   "out of memory"
4f10: 3b 0a 20 20 7d 0a 20 20 6d 65 6d 73 65 74 28 70  ;.  }.  memset(p
4f20: 52 65 2c 20 30 2c 20 73 69 7a 65 6f 66 28 2a 70  Re, 0, sizeof(*p
4f30: 52 65 29 29 3b 0a 20 20 70 52 65 2d 3e 78 4e 65  Re));.  pRe->xNe
4f40: 78 74 43 68 61 72 20 3d 20 6e 6f 43 61 73 65 20  xtChar = noCase 
4f50: 3f 20 72 65 5f 6e 65 78 74 5f 63 68 61 72 5f 6e  ? re_next_char_n
4f60: 6f 63 61 73 65 20 3a 20 72 65 5f 6e 65 78 74 5f  ocase : re_next_
4f70: 63 68 61 72 3b 0a 20 20 69 66 28 20 72 65 5f 72  char;.  if( re_r
4f80: 65 73 69 7a 65 28 70 52 65 2c 20 33 30 29 20 29  esize(pRe, 30) )
4f90: 7b 0a 20 20 20 20 72 65 5f 66 72 65 65 28 70 52  {.    re_free(pR
4fa0: 65 29 3b 0a 20 20 20 20 72 65 74 75 72 6e 20 22  e);.    return "
4fb0: 6f 75 74 20 6f 66 20 6d 65 6d 6f 72 79 22 3b 0a  out of memory";.
4fc0: 20 20 7d 0a 20 20 69 66 28 20 7a 49 6e 5b 30 5d    }.  if( zIn[0]
4fd0: 3d 3d 27 5e 27 20 29 7b 0a 20 20 20 20 7a 49 6e  =='^' ){.    zIn
4fe0: 2b 2b 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20  ++;.  }else{.   
4ff0: 20 72 65 5f 61 70 70 65 6e 64 28 70 52 65 2c 20   re_append(pRe, 
5000: 52 45 5f 4f 50 5f 41 4e 59 53 54 41 52 2c 20 30  RE_OP_ANYSTAR, 0
5010: 29 3b 0a 20 20 7d 0a 20 20 70 52 65 2d 3e 73 49  );.  }.  pRe->sI
5020: 6e 2e 7a 20 3d 20 28 75 6e 73 69 67 6e 65 64 20  n.z = (unsigned 
5030: 63 68 61 72 2a 29 7a 49 6e 3b 0a 20 20 70 52 65  char*)zIn;.  pRe
5040: 2d 3e 73 49 6e 2e 69 20 3d 20 30 3b 0a 20 20 70  ->sIn.i = 0;.  p
5050: 52 65 2d 3e 73 49 6e 2e 6d 78 20 3d 20 28 69 6e  Re->sIn.mx = (in
5060: 74 29 73 74 72 6c 65 6e 28 7a 49 6e 29 3b 0a 20  t)strlen(zIn);. 
5070: 20 7a 45 72 72 20 3d 20 72 65 5f 73 75 62 63 6f   zErr = re_subco
5080: 6d 70 69 6c 65 5f 72 65 28 70 52 65 29 3b 0a 20  mpile_re(pRe);. 
5090: 20 69 66 28 20 7a 45 72 72 20 29 7b 0a 20 20 20   if( zErr ){.   
50a0: 20 72 65 5f 66 72 65 65 28 70 52 65 29 3b 0a 20   re_free(pRe);. 
50b0: 20 20 20 72 65 74 75 72 6e 20 7a 45 72 72 3b 0a     return zErr;.
50c0: 20 20 7d 0a 20 20 69 66 28 20 72 65 50 65 65 6b    }.  if( rePeek
50d0: 28 70 52 65 29 3d 3d 27 24 27 20 26 26 20 70 52  (pRe)=='$' && pR
50e0: 65 2d 3e 73 49 6e 2e 69 2b 31 3e 3d 70 52 65 2d  e->sIn.i+1>=pRe-
50f0: 3e 73 49 6e 2e 6d 78 20 29 7b 0a 20 20 20 20 72  >sIn.mx ){.    r
5100: 65 5f 61 70 70 65 6e 64 28 70 52 65 2c 20 52 45  e_append(pRe, RE
5110: 5f 4f 50 5f 4d 41 54 43 48 2c 20 52 45 5f 45 4f  _OP_MATCH, RE_EO
5120: 46 29 3b 0a 20 20 20 20 72 65 5f 61 70 70 65 6e  F);.    re_appen
5130: 64 28 70 52 65 2c 20 52 45 5f 4f 50 5f 41 43 43  d(pRe, RE_OP_ACC
5140: 45 50 54 2c 20 30 29 3b 0a 20 20 20 20 2a 70 70  EPT, 0);.    *pp
5150: 52 65 20 3d 20 70 52 65 3b 0a 20 20 7d 65 6c 73  Re = pRe;.  }els
5160: 65 20 69 66 28 20 70 52 65 2d 3e 73 49 6e 2e 69  e if( pRe->sIn.i
5170: 3e 3d 70 52 65 2d 3e 73 49 6e 2e 6d 78 20 29 7b  >=pRe->sIn.mx ){
5180: 0a 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70  .    re_append(p
5190: 52 65 2c 20 52 45 5f 4f 50 5f 41 43 43 45 50 54  Re, RE_OP_ACCEPT
51a0: 2c 20 30 29 3b 0a 20 20 20 20 2a 70 70 52 65 20  , 0);.    *ppRe 
51b0: 3d 20 70 52 65 3b 0a 20 20 7d 65 6c 73 65 7b 0a  = pRe;.  }else{.
51c0: 20 20 20 20 72 65 5f 66 72 65 65 28 70 52 65 29      re_free(pRe)
51d0: 3b 0a 20 20 20 20 72 65 74 75 72 6e 20 22 75 6e  ;.    return "un
51e0: 72 65 63 6f 67 6e 69 7a 65 64 20 63 68 61 72 61  recognized chara
51f0: 63 74 65 72 22 3b 0a 20 20 7d 0a 0a 20 20 2f 2a  cter";.  }..  /*
5200: 20 54 68 65 20 66 6f 6c 6c 6f 77 69 6e 67 20 69   The following i
5210: 73 20 61 20 70 65 72 66 6f 72 6d 61 6e 63 65 20  s a performance 
5220: 6f 70 74 69 6d 69 7a 61 74 69 6f 6e 2e 20 20 49  optimization.  I
5230: 66 20 74 68 65 20 72 65 67 65 78 20 62 65 67 69  f the regex begi
5240: 6e 73 20 77 69 74 68 0a 20 20 2a 2a 20 22 2e 2a  ns with.  ** ".*
5250: 22 20 28 69 66 20 74 68 65 20 69 6e 70 75 74 20  " (if the input 
5260: 72 65 67 65 78 20 6c 61 63 6b 73 20 61 6e 20 69  regex lacks an i
5270: 6e 69 74 69 61 6c 20 22 5e 22 29 20 61 6e 64 20  nitial "^") and 
5280: 61 66 74 65 72 77 61 72 64 73 20 74 68 65 72 65  afterwards there
5290: 20 61 72 65 0a 20 20 2a 2a 20 6f 6e 65 20 6f 72   are.  ** one or
52a0: 20 6d 6f 72 65 20 6d 61 74 63 68 69 6e 67 20 63   more matching c
52b0: 68 61 72 61 63 74 65 72 73 2c 20 65 6e 74 65 72  haracters, enter
52c0: 20 74 68 6f 73 65 20 6d 61 74 63 68 69 6e 67 20   those matching 
52d0: 63 68 61 72 61 63 74 65 72 73 20 69 6e 74 6f 0a  characters into.
52e0: 20 20 2a 2a 20 7a 49 6e 69 74 5b 5d 2e 20 20 54    ** zInit[].  T
52f0: 68 65 20 72 65 5f 6d 61 74 63 68 28 29 20 72 6f  he re_match() ro
5300: 75 74 69 6e 65 20 63 61 6e 20 74 68 65 6e 20 73  utine can then s
5310: 65 61 72 63 68 20 61 68 65 61 64 20 69 6e 20 74  earch ahead in t
5320: 68 65 20 69 6e 70 75 74 20 0a 20 20 2a 2a 20 73  he input .  ** s
5330: 74 72 69 6e 67 20 6c 6f 6f 6b 69 6e 67 20 66 6f  tring looking fo
5340: 72 20 74 68 65 20 69 6e 69 74 69 61 6c 20 6d 61  r the initial ma
5350: 74 63 68 20 77 69 74 68 6f 75 74 20 68 61 76 69  tch without havi
5360: 6e 67 20 74 6f 20 72 75 6e 20 74 68 65 20 77 68  ng to run the wh
5370: 6f 6c 65 0a 20 20 2a 2a 20 72 65 67 65 78 20 65  ole.  ** regex e
5380: 6e 67 69 6e 65 20 6f 76 65 72 20 74 68 65 20 73  ngine over the s
5390: 74 72 69 6e 67 2e 20 20 44 6f 20 6e 6f 74 20 77  tring.  Do not w
53a0: 6f 72 72 79 20 61 62 6c 65 20 74 72 79 69 6e 67  orry able trying
53b0: 20 74 6f 20 6d 61 74 63 68 0a 20 20 2a 2a 20 75   to match.  ** u
53c0: 6e 69 63 6f 64 65 20 63 68 61 72 61 63 74 65 72  nicode character
53d0: 73 20 62 65 79 6f 6e 64 20 70 6c 61 6e 65 20 30  s beyond plane 0
53e0: 20 2d 20 74 68 6f 73 65 20 61 72 65 20 76 65 72   - those are ver
53f0: 79 20 72 61 72 65 20 61 6e 64 20 74 68 69 73 20  y rare and this 
5400: 69 73 0a 20 20 2a 2a 20 6a 75 73 74 20 61 6e 20  is.  ** just an 
5410: 6f 70 74 69 6d 69 7a 61 74 69 6f 6e 2e 20 2a 2f  optimization. */
5420: 0a 20 20 69 66 28 20 70 52 65 2d 3e 61 4f 70 5b  .  if( pRe->aOp[
5430: 30 5d 3d 3d 52 45 5f 4f 50 5f 41 4e 59 53 54 41  0]==RE_OP_ANYSTA
5440: 52 20 29 7b 0a 20 20 20 20 66 6f 72 28 6a 3d 30  R ){.    for(j=0
5450: 2c 20 69 3d 31 3b 20 6a 3c 73 69 7a 65 6f 66 28  , i=1; j<sizeof(
5460: 70 52 65 2d 3e 7a 49 6e 69 74 29 2d 32 20 26 26  pRe->zInit)-2 &&
5470: 20 70 52 65 2d 3e 61 4f 70 5b 69 5d 3d 3d 52 45   pRe->aOp[i]==RE
5480: 5f 4f 50 5f 4d 41 54 43 48 3b 20 69 2b 2b 29 7b  _OP_MATCH; i++){
5490: 0a 20 20 20 20 20 20 75 6e 73 69 67 6e 65 64 20  .      unsigned 
54a0: 78 20 3d 20 70 52 65 2d 3e 61 41 72 67 5b 69 5d  x = pRe->aArg[i]
54b0: 3b 0a 20 20 20 20 20 20 69 66 28 20 78 3c 3d 31  ;.      if( x<=1
54c0: 32 37 20 29 7b 0a 20 20 20 20 20 20 20 20 70 52  27 ){.        pR
54d0: 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20  e->zInit[j++] = 
54e0: 28 75 6e 73 69 67 6e 65 64 20 63 68 61 72 29 78  (unsigned char)x
54f0: 3b 0a 20 20 20 20 20 20 7d 65 6c 73 65 20 69 66  ;.      }else if
5500: 28 20 78 3c 3d 30 78 66 66 66 20 29 7b 0a 20 20  ( x<=0xfff ){.  
5510: 20 20 20 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74        pRe->zInit
5520: 5b 6a 2b 2b 5d 20 3d 20 28 75 6e 73 69 67 6e 65  [j++] = (unsigne
5530: 64 20 63 68 61 72 29 28 30 78 63 30 20 7c 20 28  d char)(0xc0 | (
5540: 78 3e 3e 36 29 29 3b 0a 20 20 20 20 20 20 20 20  x>>6));.        
5550: 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20  pRe->zInit[j++] 
5560: 3d 20 30 78 38 30 20 7c 20 28 78 26 30 78 33 66  = 0x80 | (x&0x3f
5570: 29 3b 0a 20 20 20 20 20 20 7d 65 6c 73 65 20 69  );.      }else i
5580: 66 28 20 78 3c 3d 30 78 66 66 66 66 20 29 7b 0a  f( x<=0xffff ){.
5590: 20 20 20 20 20 20 20 20 70 52 65 2d 3e 7a 49 6e          pRe->zIn
55a0: 69 74 5b 6a 2b 2b 5d 20 3d 20 28 75 6e 73 69 67  it[j++] = (unsig
55b0: 6e 65 64 20 63 68 61 72 29 28 30 78 64 30 20 7c  ned char)(0xd0 |
55c0: 20 28 78 3e 3e 31 32 29 29 3b 0a 20 20 20 20 20   (x>>12));.     
55d0: 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b     pRe->zInit[j+
55e0: 2b 5d 20 3d 20 30 78 38 30 20 7c 20 28 28 78 3e  +] = 0x80 | ((x>
55f0: 3e 36 29 26 30 78 33 66 29 3b 0a 20 20 20 20 20  >6)&0x3f);.     
5600: 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b     pRe->zInit[j+
5610: 2b 5d 20 3d 20 30 78 38 30 20 7c 20 28 78 26 30  +] = 0x80 | (x&0
5620: 78 33 66 29 3b 0a 20 20 20 20 20 20 7d 65 6c 73  x3f);.      }els
5630: 65 7b 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b  e{.        break
5640: 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 7d 0a  ;.      }.    }.
5650: 20 20 20 20 69 66 28 20 6a 3e 30 20 26 26 20 70      if( j>0 && p
5660: 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2d 31 5d 3d 3d  Re->zInit[j-1]==
5670: 30 20 29 20 6a 2d 2d 3b 0a 20 20 20 20 70 52 65  0 ) j--;.    pRe
5680: 2d 3e 6e 49 6e 69 74 20 3d 20 6a 3b 0a 20 20 7d  ->nInit = j;.  }
5690: 0a 20 20 72 65 74 75 72 6e 20 70 52 65 2d 3e 7a  .  return pRe->z
56a0: 45 72 72 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 49 6d  Err;.}../*.** Im
56b0: 70 6c 65 6d 65 6e 74 61 74 69 6f 6e 20 6f 66 20  plementation of 
56c0: 74 68 65 20 72 65 67 65 78 70 28 29 20 53 51 4c  the regexp() SQL
56d0: 20 66 75 6e 63 74 69 6f 6e 2e 20 20 54 68 69 73   function.  This
56e0: 20 66 75 6e 63 74 69 6f 6e 20 69 6d 70 6c 65 6d   function implem
56f0: 65 6e 74 73 0a 2a 2a 20 74 68 65 20 62 75 69 6c  ents.** the buil
5700: 64 2d 69 6e 20 52 45 47 45 58 50 20 6f 70 65 72  d-in REGEXP oper
5710: 61 74 6f 72 2e 20 20 54 68 65 20 66 69 72 73 74  ator.  The first
5720: 20 61 72 67 75 6d 65 6e 74 20 74 6f 20 74 68 65   argument to the
5730: 20 66 75 6e 63 74 69 6f 6e 20 69 73 20 74 68 65   function is the
5740: 0a 2a 2a 20 70 61 74 74 65 72 6e 20 61 6e 64 20  .** pattern and 
5750: 74 68 65 20 73 65 63 6f 6e 64 20 61 72 67 75 6d  the second argum
5760: 65 6e 74 20 69 73 20 74 68 65 20 73 74 72 69 6e  ent is the strin
5770: 67 2e 20 20 53 6f 2c 20 74 68 65 20 53 51 4c 20  g.  So, the SQL 
5780: 73 74 61 74 65 6d 65 6e 74 73 3a 0a 2a 2a 0a 2a  statements:.**.*
5790: 2a 20 20 20 20 20 20 20 41 20 52 45 47 45 58 50  *       A REGEXP
57a0: 20 42 0a 2a 2a 0a 2a 2a 20 69 73 20 69 6d 70 6c   B.**.** is impl
57b0: 65 6d 65 6e 74 65 64 20 61 73 20 72 65 67 65 78  emented as regex
57c0: 70 28 42 2c 41 29 2e 0a 2a 2f 0a 73 74 61 74 69  p(B,A)..*/.stati
57d0: 63 20 76 6f 69 64 20 72 65 5f 73 71 6c 5f 66 75  c void re_sql_fu
57e0: 6e 63 28 0a 20 20 73 71 6c 69 74 65 33 5f 63 6f  nc(.  sqlite3_co
57f0: 6e 74 65 78 74 20 2a 63 6f 6e 74 65 78 74 2c 20  ntext *context, 
5800: 0a 20 20 69 6e 74 20 61 72 67 63 2c 20 0a 20 20  .  int argc, .  
5810: 73 71 6c 69 74 65 33 5f 76 61 6c 75 65 20 2a 2a  sqlite3_value **
5820: 61 72 67 76 0a 29 7b 0a 20 20 52 65 43 6f 6d 70  argv.){.  ReComp
5830: 69 6c 65 64 20 2a 70 52 65 3b 20 20 20 20 20 20  iled *pRe;      
5840: 20 20 20 20 2f 2a 20 43 6f 6d 70 69 6c 65 64 20      /* Compiled 
5850: 72 65 67 75 6c 61 72 20 65 78 70 72 65 73 73 69  regular expressi
5860: 6f 6e 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63 68  on */.  const ch
5870: 61 72 20 2a 7a 50 61 74 74 65 72 6e 3b 20 20 20  ar *zPattern;   
5880: 20 20 2f 2a 20 54 68 65 20 72 65 67 75 6c 61 72    /* The regular
5890: 20 65 78 70 72 65 73 73 69 6f 6e 20 2a 2f 0a 20   expression */. 
58a0: 20 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20   const unsigned 
58b0: 63 68 61 72 20 2a 7a 53 74 72 3b 2f 2a 20 53 74  char *zStr;/* St
58c0: 72 69 6e 67 20 62 65 69 6e 67 20 73 65 61 72 63  ring being searc
58d0: 68 65 64 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63  hed */.  const c
58e0: 68 61 72 20 2a 7a 45 72 72 3b 20 20 20 20 20 20  har *zErr;      
58f0: 20 20 20 2f 2a 20 43 6f 6d 70 69 6c 65 20 65 72     /* Compile er
5900: 72 6f 72 20 6d 65 73 73 61 67 65 20 2a 2f 0a 20  ror message */. 
5910: 20 69 6e 74 20 73 65 74 41 75 78 20 3d 20 30 3b   int setAux = 0;
5920: 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20 54 72             /* Tr
5930: 75 65 20 74 6f 20 69 6e 76 6f 6b 65 20 73 71 6c  ue to invoke sql
5940: 69 74 65 33 5f 73 65 74 5f 61 75 78 64 61 74 61  ite3_set_auxdata
5950: 28 29 20 2a 2f 0a 0a 20 20 70 52 65 20 3d 20 73  () */..  pRe = s
5960: 71 6c 69 74 65 33 5f 67 65 74 5f 61 75 78 64 61  qlite3_get_auxda
5970: 74 61 28 63 6f 6e 74 65 78 74 2c 20 30 29 3b 0a  ta(context, 0);.
5980: 20 20 69 66 28 20 70 52 65 3d 3d 30 20 29 7b 0a    if( pRe==0 ){.
5990: 20 20 20 20 7a 50 61 74 74 65 72 6e 20 3d 20 28      zPattern = (
59a0: 63 6f 6e 73 74 20 63 68 61 72 2a 29 73 71 6c 69  const char*)sqli
59b0: 74 65 33 5f 76 61 6c 75 65 5f 74 65 78 74 28 61  te3_value_text(a
59c0: 72 67 76 5b 30 5d 29 3b 0a 20 20 20 20 69 66 28  rgv[0]);.    if(
59d0: 20 7a 50 61 74 74 65 72 6e 3d 3d 30 20 29 20 72   zPattern==0 ) r
59e0: 65 74 75 72 6e 3b 0a 20 20 20 20 7a 45 72 72 20  eturn;.    zErr 
59f0: 3d 20 72 65 5f 63 6f 6d 70 69 6c 65 28 26 70 52  = re_compile(&pR
5a00: 65 2c 20 7a 50 61 74 74 65 72 6e 2c 20 30 29 3b  e, zPattern, 0);
5a10: 0a 20 20 20 20 69 66 28 20 7a 45 72 72 20 29 7b  .    if( zErr ){
5a20: 0a 20 20 20 20 20 20 72 65 5f 66 72 65 65 28 70  .      re_free(p
5a30: 52 65 29 3b 0a 20 20 20 20 20 20 73 71 6c 69 74  Re);.      sqlit
5a40: 65 33 5f 72 65 73 75 6c 74 5f 65 72 72 6f 72 28  e3_result_error(
5a50: 63 6f 6e 74 65 78 74 2c 20 7a 45 72 72 2c 20 2d  context, zErr, -
5a60: 31 29 3b 0a 20 20 20 20 20 20 72 65 74 75 72 6e  1);.      return
5a70: 3b 0a 20 20 20 20 7d 0a 20 20 20 20 69 66 28 20  ;.    }.    if( 
5a80: 70 52 65 3d 3d 30 20 29 7b 0a 20 20 20 20 20 20  pRe==0 ){.      
5a90: 73 71 6c 69 74 65 33 5f 72 65 73 75 6c 74 5f 65  sqlite3_result_e
5aa0: 72 72 6f 72 5f 6e 6f 6d 65 6d 28 63 6f 6e 74 65  rror_nomem(conte
5ab0: 78 74 29 3b 0a 20 20 20 20 20 20 72 65 74 75 72  xt);.      retur
5ac0: 6e 3b 0a 20 20 20 20 7d 0a 20 20 20 20 73 65 74  n;.    }.    set
5ad0: 41 75 78 20 3d 20 31 3b 0a 20 20 7d 0a 20 20 7a  Aux = 1;.  }.  z
5ae0: 53 74 72 20 3d 20 28 63 6f 6e 73 74 20 75 6e 73  Str = (const uns
5af0: 69 67 6e 65 64 20 63 68 61 72 2a 29 73 71 6c 69  igned char*)sqli
5b00: 74 65 33 5f 76 61 6c 75 65 5f 74 65 78 74 28 61  te3_value_text(a
5b10: 72 67 76 5b 31 5d 29 3b 0a 20 20 69 66 28 20 7a  rgv[1]);.  if( z
5b20: 53 74 72 21 3d 30 20 29 7b 0a 20 20 20 20 73 71  Str!=0 ){.    sq
5b30: 6c 69 74 65 33 5f 72 65 73 75 6c 74 5f 69 6e 74  lite3_result_int
5b40: 28 63 6f 6e 74 65 78 74 2c 20 72 65 5f 6d 61 74  (context, re_mat
5b50: 63 68 28 70 52 65 2c 20 7a 53 74 72 2c 20 2d 31  ch(pRe, zStr, -1
5b60: 29 29 3b 0a 20 20 7d 0a 20 20 69 66 28 20 73 65  ));.  }.  if( se
5b70: 74 41 75 78 20 29 7b 0a 20 20 20 20 73 71 6c 69  tAux ){.    sqli
5b80: 74 65 33 5f 73 65 74 5f 61 75 78 64 61 74 61 28  te3_set_auxdata(
5b90: 63 6f 6e 74 65 78 74 2c 20 30 2c 20 70 52 65 2c  context, 0, pRe,
5ba0: 20 28 76 6f 69 64 28 2a 29 28 76 6f 69 64 2a 29   (void(*)(void*)
5bb0: 29 72 65 5f 66 72 65 65 29 3b 0a 20 20 7d 0a 7d  )re_free);.  }.}
5bc0: 0a 0a 2f 2a 0a 2a 2a 20 49 6e 76 6f 6b 65 20 74  ../*.** Invoke t
5bd0: 68 69 73 20 72 6f 75 74 69 6e 65 20 74 6f 20 72  his routine to r
5be0: 65 67 69 73 74 65 72 20 74 68 65 20 72 65 67 65  egister the rege
5bf0: 78 70 28 29 20 66 75 6e 63 74 69 6f 6e 20 77 69  xp() function wi
5c00: 74 68 20 74 68 65 0a 2a 2a 20 53 51 4c 69 74 65  th the.** SQLite
5c10: 20 64 61 74 61 62 61 73 65 20 63 6f 6e 6e 65 63   database connec
5c20: 74 69 6f 6e 2e 0a 2a 2f 0a 23 69 66 64 65 66 20  tion..*/.#ifdef 
5c30: 5f 57 49 4e 33 32 0a 5f 5f 64 65 63 6c 73 70 65  _WIN32.__declspe
5c40: 63 28 64 6c 6c 65 78 70 6f 72 74 29 0a 23 65 6e  c(dllexport).#en
5c50: 64 69 66 0a 69 6e 74 20 73 71 6c 69 74 65 33 5f  dif.int sqlite3_
5c60: 72 65 67 65 78 70 5f 69 6e 69 74 28 0a 20 20 73  regexp_init(.  s
5c70: 71 6c 69 74 65 33 20 2a 64 62 2c 20 0a 20 20 63  qlite3 *db, .  c
5c80: 68 61 72 20 2a 2a 70 7a 45 72 72 4d 73 67 2c 20  har **pzErrMsg, 
5c90: 0a 20 20 63 6f 6e 73 74 20 73 71 6c 69 74 65 33  .  const sqlite3
5ca0: 5f 61 70 69 5f 72 6f 75 74 69 6e 65 73 20 2a 70  _api_routines *p
5cb0: 41 70 69 0a 29 7b 0a 20 20 69 6e 74 20 72 63 20  Api.){.  int rc 
5cc0: 3d 20 53 51 4c 49 54 45 5f 4f 4b 3b 0a 20 20 53  = SQLITE_OK;.  S
5cd0: 51 4c 49 54 45 5f 45 58 54 45 4e 53 49 4f 4e 5f  QLITE_EXTENSION_
5ce0: 49 4e 49 54 32 28 70 41 70 69 29 3b 0a 20 20 72  INIT2(pApi);.  r
5cf0: 63 20 3d 20 73 71 6c 69 74 65 33 5f 63 72 65 61  c = sqlite3_crea
5d00: 74 65 5f 66 75 6e 63 74 69 6f 6e 28 64 62 2c 20  te_function(db, 
5d10: 22 72 65 67 65 78 70 22 2c 20 32 2c 20 53 51 4c  "regexp", 2, SQL
5d20: 49 54 45 5f 55 54 46 38 2c 20 30 2c 0a 20 20 20  ITE_UTF8, 0,.   
5d30: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
5d40: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 72 65                re
5d50: 5f 73 71 6c 5f 66 75 6e 63 2c 20 30 2c 20 30 29  _sql_func, 0, 0)
5d60: 3b 0a 20 20 72 65 74 75 72 6e 20 72 63 3b 0a 7d  ;.  return rc;.}
5d70: 0a                                               .