/ Hex Artifact Content
Login

Artifact 08748a68ddb3b29329dbdade5ede849a749f0c07:


0000: 2f 2a 0a 2a 2a 20 32 30 31 32 2d 31 31 2d 31 33  /*.** 2012-11-13
0010: 0a 2a 2a 0a 2a 2a 20 54 68 65 20 61 75 74 68 6f  .**.** The autho
0020: 72 20 64 69 73 63 6c 61 69 6d 73 20 63 6f 70 79  r disclaims copy
0030: 72 69 67 68 74 20 74 6f 20 74 68 69 73 20 73 6f  right to this so
0040: 75 72 63 65 20 63 6f 64 65 2e 20 20 49 6e 20 70  urce code.  In p
0050: 6c 61 63 65 20 6f 66 0a 2a 2a 20 61 20 6c 65 67  lace of.** a leg
0060: 61 6c 20 6e 6f 74 69 63 65 2c 20 68 65 72 65 20  al notice, here 
0070: 69 73 20 61 20 62 6c 65 73 73 69 6e 67 3a 0a 2a  is a blessing:.*
0080: 2a 0a 2a 2a 20 20 20 20 4d 61 79 20 79 6f 75 20  *.**    May you 
0090: 64 6f 20 67 6f 6f 64 20 61 6e 64 20 6e 6f 74 20  do good and not 
00a0: 65 76 69 6c 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  evil..**    May 
00b0: 79 6f 75 20 66 69 6e 64 20 66 6f 72 67 69 76 65  you find forgive
00c0: 6e 65 73 73 20 66 6f 72 20 79 6f 75 72 73 65 6c  ness for yoursel
00d0: 66 20 61 6e 64 20 66 6f 72 67 69 76 65 20 6f 74  f and forgive ot
00e0: 68 65 72 73 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  hers..**    May 
00f0: 79 6f 75 20 73 68 61 72 65 20 66 72 65 65 6c 79  you share freely
0100: 2c 20 6e 65 76 65 72 20 74 61 6b 69 6e 67 20 6d  , never taking m
0110: 6f 72 65 20 74 68 61 6e 20 79 6f 75 20 67 69 76  ore than you giv
0120: 65 2e 0a 2a 2a 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  e..**.**********
0130: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0140: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0150: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0160: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0170: 2a 2a 2a 2a 0a 2a 2a 0a 2a 2a 20 54 68 65 20 63  ****.**.** The c
0180: 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c 65  ode in this file
0190: 20 69 6d 70 6c 65 6d 65 6e 74 73 20 61 20 63 6f   implements a co
01a0: 6d 70 61 63 74 20 62 75 74 20 72 65 61 73 6f 6e  mpact but reason
01b0: 61 62 6c 79 0a 2a 2a 20 65 66 66 69 63 69 65 6e  ably.** efficien
01c0: 74 20 72 65 67 75 6c 61 72 2d 65 78 70 72 65 73  t regular-expres
01d0: 73 69 6f 6e 20 6d 61 74 63 68 65 72 20 66 6f 72  sion matcher for
01e0: 20 70 6f 73 69 78 20 65 78 74 65 6e 64 65 64 20   posix extended 
01f0: 72 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70 72 65  regular.** expre
0200: 73 73 69 6f 6e 73 20 61 67 61 69 6e 73 74 20 55  ssions against U
0210: 54 46 38 20 74 65 78 74 2e 20 20 54 68 65 20 66  TF8 text.  The f
0220: 6f 6c 6c 6f 77 69 6e 67 20 73 79 6e 74 61 78 20  ollowing syntax 
0230: 69 73 20 73 75 70 70 6f 72 74 65 64 3a 0a 2a 2a  is supported:.**
0240: 0a 2a 2a 20 20 20 20 20 58 2a 20 20 20 20 20 20  .**     X*      
0250: 7a 65 72 6f 20 6f 72 20 6d 6f 72 65 20 6f 63 63  zero or more occ
0260: 75 72 72 65 6e 63 65 73 20 6f 66 20 58 0a 2a 2a  urrences of X.**
0270: 20 20 20 20 20 58 2b 20 20 20 20 20 20 6f 6e 65       X+      one
0280: 20 6f 72 20 6d 6f 72 65 20 6f 63 63 75 72 72 65   or more occurre
0290: 6e 63 65 73 20 6f 66 20 58 0a 2a 2a 20 20 20 20  nces of X.**    
02a0: 20 58 3f 20 20 20 20 20 20 7a 65 72 6f 20 6f 72   X?      zero or
02b0: 20 6f 6e 65 20 6f 63 63 75 72 72 65 6e 63 65 73   one occurrences
02c0: 20 6f 66 20 58 0a 2a 2a 20 20 20 20 20 58 7b 70   of X.**     X{p
02d0: 2c 71 7d 20 20 62 65 74 77 65 65 6e 20 70 20 61  ,q}  between p a
02e0: 6e 64 20 71 20 6f 63 63 75 72 72 65 6e 63 65 73  nd q occurrences
02f0: 20 6f 66 20 58 0a 2a 2a 20 20 20 20 20 28 58 29   of X.**     (X)
0300: 20 20 20 20 20 6d 61 74 63 68 20 58 0a 2a 2a 20       match X.** 
0310: 20 20 20 20 58 7c 59 20 20 20 20 20 58 20 6f 72      X|Y     X or
0320: 20 59 0a 2a 2a 20 20 20 20 20 5e 58 20 20 20 20   Y.**     ^X    
0330: 20 20 58 20 6f 63 63 75 72 72 69 6e 67 20 61 74    X occurring at
0340: 20 74 68 65 20 62 65 67 69 6e 6e 69 6e 67 20 6f   the beginning o
0350: 66 20 74 68 65 20 73 74 72 69 6e 67 0a 2a 2a 20  f the string.** 
0360: 20 20 20 20 58 24 20 20 20 20 20 20 58 20 6f 63      X$      X oc
0370: 63 75 72 72 69 6e 67 20 61 74 20 74 68 65 20 65  curring at the e
0380: 6e 64 20 6f 66 20 74 68 65 20 73 74 72 69 6e 67  nd of the string
0390: 0a 2a 2a 20 20 20 20 20 2e 20 20 20 20 20 20 20  .**     .       
03a0: 4d 61 74 63 68 20 61 6e 79 20 73 69 6e 67 6c 65  Match any single
03b0: 20 63 68 61 72 61 63 74 65 72 0a 2a 2a 20 20 20   character.**   
03c0: 20 20 5c 63 20 20 20 20 20 20 43 68 61 72 61 63    \c      Charac
03d0: 74 65 72 20 63 20 77 68 65 72 65 20 63 20 69 73  ter c where c is
03e0: 20 6f 6e 65 20 6f 66 20 5c 7b 7d 28 29 5b 5d 7c   one of \{}()[]|
03f0: 2a 2b 3f 2e 0a 2a 2a 20 20 20 20 20 5c 63 20 20  *+?..**     \c  
0400: 20 20 20 20 43 2d 6c 61 6e 67 75 61 67 65 20 65      C-language e
0410: 73 63 61 70 65 73 20 66 6f 72 20 63 20 69 6e 20  scapes for c in 
0420: 61 66 6e 72 74 76 2e 20 20 65 78 3a 20 5c 74 20  afnrtv.  ex: \t 
0430: 6f 72 20 5c 6e 0a 2a 2a 20 20 20 20 20 5c 75 58  or \n.**     \uX
0440: 58 58 58 20 20 57 68 65 72 65 20 58 58 58 58 20  XXX  Where XXXX 
0450: 69 73 20 65 78 61 63 74 6c 79 20 34 20 68 65 78  is exactly 4 hex
0460: 20 64 69 67 69 74 73 2c 20 75 6e 69 63 6f 64 65   digits, unicode
0470: 20 76 61 6c 75 65 20 58 58 58 58 0a 2a 2a 20 20   value XXXX.**  
0480: 20 20 20 5c 78 58 58 20 20 20 20 57 68 65 72 65     \xXX    Where
0490: 20 58 58 20 69 73 20 65 78 61 63 74 6c 79 20 32   XX is exactly 2
04a0: 20 68 65 78 20 64 69 67 69 74 73 2c 20 75 6e 69   hex digits, uni
04b0: 63 6f 64 65 20 76 61 6c 75 65 20 58 58 0a 2a 2a  code value XX.**
04c0: 20 20 20 20 20 5b 61 62 63 5d 20 20 20 41 6e 79       [abc]   Any
04d0: 20 73 69 6e 67 6c 65 20 63 68 61 72 61 63 74 65   single characte
04e0: 72 20 66 72 6f 6d 20 74 68 65 20 73 65 74 20 61  r from the set a
04f0: 62 63 0a 2a 2a 20 20 20 20 20 5b 5e 61 62 63 5d  bc.**     [^abc]
0500: 20 20 41 6e 79 20 73 69 6e 67 6c 65 20 63 68 61    Any single cha
0510: 72 61 63 74 65 72 20 6e 6f 74 20 69 6e 20 74 68  racter not in th
0520: 65 20 73 65 74 20 61 62 63 0a 2a 2a 20 20 20 20  e set abc.**    
0530: 20 5b 61 2d 7a 5d 20 20 20 41 6e 79 20 73 69 6e   [a-z]   Any sin
0540: 67 6c 65 20 63 68 61 72 61 63 74 65 72 20 69 6e  gle character in
0550: 20 74 68 65 20 72 61 6e 67 65 20 61 2d 7a 0a 2a   the range a-z.*
0560: 2a 20 20 20 20 20 5b 5e 61 2d 7a 5d 20 20 41 6e  *     [^a-z]  An
0570: 79 20 73 69 6e 67 6c 65 20 63 68 61 72 61 63 74  y single charact
0580: 65 72 20 6e 6f 74 20 69 6e 20 74 68 65 20 72 61  er not in the ra
0590: 6e 67 65 20 61 2d 7a 0a 2a 2a 20 20 20 20 20 5c  nge a-z.**     \
05a0: 62 20 20 20 20 20 20 57 6f 72 64 20 62 6f 75 6e  b      Word boun
05b0: 64 61 72 79 0a 2a 2a 20 20 20 20 20 5c 77 20 20  dary.**     \w  
05c0: 20 20 20 20 57 6f 72 64 20 63 68 61 72 61 63 74      Word charact
05d0: 65 72 2e 20 20 5b 41 2d 5a 61 2d 7a 30 2d 39 5f  er.  [A-Za-z0-9_
05e0: 5d 0a 2a 2a 20 20 20 20 20 5c 57 20 20 20 20 20  ].**     \W     
05f0: 20 4e 6f 6e 2d 77 6f 72 64 20 63 68 61 72 61 63   Non-word charac
0600: 74 65 72 0a 2a 2a 20 20 20 20 20 5c 64 20 20 20  ter.**     \d   
0610: 20 20 20 44 69 67 69 74 0a 2a 2a 20 20 20 20 20     Digit.**     
0620: 5c 44 20 20 20 20 20 20 4e 6f 6e 2d 64 69 67 69  \D      Non-digi
0630: 74 0a 2a 2a 20 20 20 20 20 5c 73 20 20 20 20 20  t.**     \s     
0640: 20 57 68 69 74 65 73 70 61 63 65 20 63 68 61 72   Whitespace char
0650: 61 63 74 65 72 0a 2a 2a 20 20 20 20 20 5c 53 20  acter.**     \S 
0660: 20 20 20 20 20 4e 6f 6e 2d 77 68 69 74 65 73 70       Non-whitesp
0670: 61 63 65 20 63 68 61 72 61 63 74 65 72 0a 2a 2a  ace character.**
0680: 0a 2a 2a 20 41 20 6e 6f 6e 64 65 74 65 72 6d 69  .** A nondetermi
0690: 6e 69 73 74 69 63 20 66 69 6e 69 74 65 20 61 75  nistic finite au
06a0: 74 6f 6d 61 74 6f 6e 20 28 4e 46 41 29 20 69 73  tomaton (NFA) is
06b0: 20 75 73 65 64 20 66 6f 72 20 6d 61 74 63 68 69   used for matchi
06c0: 6e 67 2c 20 73 6f 20 74 68 65 0a 2a 2a 20 70 65  ng, so the.** pe
06d0: 72 66 6f 72 6d 61 6e 63 65 20 69 73 20 62 6f 75  rformance is bou
06e0: 6e 64 65 64 20 62 79 20 4f 28 4e 2a 4d 29 20 77  nded by O(N*M) w
06f0: 68 65 72 65 20 4e 20 69 73 20 74 68 65 20 73 69  here N is the si
0700: 7a 65 20 6f 66 20 74 68 65 20 72 65 67 75 6c 61  ze of the regula
0710: 72 0a 2a 2a 20 65 78 70 72 65 73 73 69 6f 6e 20  r.** expression 
0720: 61 6e 64 20 4d 20 69 73 20 74 68 65 20 73 69 7a  and M is the siz
0730: 65 20 6f 66 20 74 68 65 20 69 6e 70 75 74 20 73  e of the input s
0740: 74 72 69 6e 67 2e 20 20 54 68 65 20 6d 61 74 63  tring.  The matc
0750: 68 65 72 20 6e 65 76 65 72 0a 2a 2a 20 65 78 68  her never.** exh
0760: 69 62 69 74 73 20 65 78 70 6f 6e 65 6e 74 69 61  ibits exponentia
0770: 6c 20 62 65 68 61 76 69 6f 72 2e 20 20 4e 6f 74  l behavior.  Not
0780: 65 20 74 68 61 74 20 74 68 65 20 58 7b 70 2c 71  e that the X{p,q
0790: 7d 20 6f 70 65 72 61 74 6f 72 20 65 78 70 61 6e  } operator expan
07a0: 64 73 0a 2a 2a 20 74 6f 20 70 20 63 6f 70 69 65  ds.** to p copie
07b0: 73 20 6f 66 20 58 20 66 6f 6c 6c 6f 77 69 6e 67  s of X following
07c0: 20 62 79 20 71 2d 70 20 63 6f 70 69 65 73 20 6f   by q-p copies o
07d0: 66 20 58 3f 20 61 6e 64 20 74 68 61 74 20 74 68  f X? and that th
07e0: 65 20 73 69 7a 65 20 6f 66 20 74 68 65 0a 2a 2a  e size of the.**
07f0: 20 72 65 67 75 6c 61 72 20 65 78 70 72 65 73 73   regular express
0800: 69 6f 6e 20 69 6e 20 74 68 65 20 4f 28 4e 2a 4d  ion in the O(N*M
0810: 29 20 70 65 72 66 6f 72 6d 61 6e 63 65 20 62 6f  ) performance bo
0820: 75 6e 64 20 69 73 20 63 6f 6d 70 75 74 65 64 20  und is computed 
0830: 61 66 74 65 72 0a 2a 2a 20 74 68 69 73 20 65 78  after.** this ex
0840: 70 61 6e 73 69 6f 6e 2e 0a 2a 2f 0a 23 69 6e 63  pansion..*/.#inc
0850: 6c 75 64 65 20 3c 73 74 72 69 6e 67 2e 68 3e 0a  lude <string.h>.
0860: 23 69 6e 63 6c 75 64 65 20 3c 73 74 64 6c 69 62  #include <stdlib
0870: 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 22 73 71  .h>.#include "sq
0880: 6c 69 74 65 33 2e 68 22 0a 0a 2f 2a 20 54 68 65  lite3.h"../* The
0890: 20 65 6e 64 2d 6f 66 2d 69 6e 70 75 74 20 63 68   end-of-input ch
08a0: 61 72 61 63 74 65 72 20 2a 2f 0a 23 64 65 66 69  aracter */.#defi
08b0: 6e 65 20 52 45 5f 45 4f 46 20 20 20 20 20 20 20  ne RE_EOF       
08c0: 20 20 20 20 20 30 20 20 20 20 2f 2a 20 45 6e 64       0    /* End
08d0: 20 6f 66 20 69 6e 70 75 74 20 2a 2f 0a 0a 2f 2a   of input */../*
08e0: 20 54 68 65 20 4e 46 41 20 69 73 20 69 6d 70 6c   The NFA is impl
08f0: 65 6d 65 6e 74 65 64 20 61 73 20 73 65 71 75 65  emented as seque
0900: 6e 63 65 20 6f 66 20 6f 70 63 6f 64 65 73 20 74  nce of opcodes t
0910: 61 6b 65 6e 20 66 72 6f 6d 20 74 68 65 20 66 6f  aken from the fo
0920: 6c 6c 6f 77 69 6e 67 0a 2a 2a 20 73 65 74 2e 20  llowing.** set. 
0930: 20 45 61 63 68 20 6f 70 63 6f 64 65 20 68 61 73   Each opcode has
0940: 20 61 20 73 69 6e 67 6c 65 20 69 6e 74 65 67 65   a single intege
0950: 72 20 61 72 67 75 6d 65 6e 74 2e 0a 2a 2f 0a 23  r argument..*/.#
0960: 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 4d 41 54  define RE_OP_MAT
0970: 43 48 20 20 20 20 20 20 20 31 20 20 20 20 2f 2a  CH       1    /*
0980: 20 4d 61 74 63 68 20 74 68 65 20 6f 6e 65 20 63   Match the one c
0990: 68 61 72 61 63 74 65 72 20 69 6e 20 74 68 65 20  haracter in the 
09a0: 61 72 67 75 6d 65 6e 74 20 2a 2f 0a 23 64 65 66  argument */.#def
09b0: 69 6e 65 20 52 45 5f 4f 50 5f 41 4e 59 20 20 20  ine RE_OP_ANY   
09c0: 20 20 20 20 20 20 32 20 20 20 20 2f 2a 20 4d 61        2    /* Ma
09d0: 74 63 68 20 61 6e 79 20 6f 6e 65 20 63 68 61 72  tch any one char
09e0: 61 63 74 65 72 2e 20 20 28 49 6d 70 6c 65 6d 65  acter.  (Impleme
09f0: 6e 74 73 20 22 2e 22 29 20 2a 2f 0a 23 64 65 66  nts ".") */.#def
0a00: 69 6e 65 20 52 45 5f 4f 50 5f 41 4e 59 53 54 41  ine RE_OP_ANYSTA
0a10: 52 20 20 20 20 20 33 20 20 20 20 2f 2a 20 53 70  R     3    /* Sp
0a20: 65 63 69 61 6c 20 6f 70 74 69 6d 69 7a 65 64 20  ecial optimized 
0a30: 76 65 72 73 69 6f 6e 20 6f 66 20 2e 2a 20 2a 2f  version of .* */
0a40: 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 46  .#define RE_OP_F
0a50: 4f 52 4b 20 20 20 20 20 20 20 20 34 20 20 20 20  ORK        4    
0a60: 2f 2a 20 43 6f 6e 74 69 6e 75 65 20 74 6f 20 62  /* Continue to b
0a70: 6f 74 68 20 6e 65 78 74 20 61 6e 64 20 6f 70 63  oth next and opc
0a80: 6f 64 65 20 61 74 20 69 41 72 67 20 2a 2f 0a 23  ode at iArg */.#
0a90: 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 47 4f 54  define RE_OP_GOT
0aa0: 4f 20 20 20 20 20 20 20 20 35 20 20 20 20 2f 2a  O        5    /*
0ab0: 20 4a 75 6d 70 20 74 6f 20 6f 70 63 6f 64 65 20   Jump to opcode 
0ac0: 61 74 20 69 41 72 67 20 2a 2f 0a 23 64 65 66 69  at iArg */.#defi
0ad0: 6e 65 20 52 45 5f 4f 50 5f 41 43 43 45 50 54 20  ne RE_OP_ACCEPT 
0ae0: 20 20 20 20 20 36 20 20 20 20 2f 2a 20 48 61 6c       6    /* Hal
0af0: 74 20 61 6e 64 20 69 6e 64 69 63 61 74 65 20 61  t and indicate a
0b00: 20 73 75 63 63 65 73 73 66 75 6c 20 6d 61 74 63   successful matc
0b10: 68 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f  h */.#define RE_
0b20: 4f 50 5f 43 43 5f 49 4e 43 20 20 20 20 20 20 37  OP_CC_INC      7
0b30: 20 20 20 20 2f 2a 20 42 65 67 69 6e 6e 69 6e 67      /* Beginning
0b40: 20 6f 66 20 61 20 5b 2e 2e 2e 5d 20 63 68 61 72   of a [...] char
0b50: 61 63 74 65 72 20 63 6c 61 73 73 20 2a 2f 0a 23  acter class */.#
0b60: 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 43 43 5f  define RE_OP_CC_
0b70: 45 58 43 20 20 20 20 20 20 38 20 20 20 20 2f 2a  EXC      8    /*
0b80: 20 42 65 67 69 6e 6e 69 6e 67 20 6f 66 20 61 20   Beginning of a 
0b90: 5b 5e 2e 2e 2e 5d 20 63 68 61 72 61 63 74 65 72  [^...] character
0ba0: 20 63 6c 61 73 73 20 2a 2f 0a 23 64 65 66 69 6e   class */.#defin
0bb0: 65 20 52 45 5f 4f 50 5f 43 43 5f 56 41 4c 55 45  e RE_OP_CC_VALUE
0bc0: 20 20 20 20 39 20 20 20 20 2f 2a 20 53 69 6e 67      9    /* Sing
0bd0: 6c 65 20 76 61 6c 75 65 20 69 6e 20 61 20 63 68  le value in a ch
0be0: 61 72 61 63 74 65 72 20 63 6c 61 73 73 20 2a 2f  aracter class */
0bf0: 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 43  .#define RE_OP_C
0c00: 43 5f 52 41 4e 47 45 20 20 20 31 30 20 20 20 20  C_RANGE   10    
0c10: 2f 2a 20 52 61 6e 67 65 20 6f 66 20 76 61 6c 75  /* Range of valu
0c20: 65 73 20 69 6e 20 61 20 63 68 61 72 61 63 74 65  es in a characte
0c30: 72 20 63 6c 61 73 73 20 2a 2f 0a 23 64 65 66 69  r class */.#defi
0c40: 6e 65 20 52 45 5f 4f 50 5f 57 4f 52 44 20 20 20  ne RE_OP_WORD   
0c50: 20 20 20 20 31 31 20 20 20 20 2f 2a 20 50 65 72      11    /* Per
0c60: 6c 20 77 6f 72 64 20 63 68 61 72 61 63 74 65 72  l word character
0c70: 20 5b 41 2d 5a 61 2d 7a 30 2d 39 5f 5d 20 2a 2f   [A-Za-z0-9_] */
0c80: 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 4e  .#define RE_OP_N
0c90: 4f 54 57 4f 52 44 20 20 20 20 31 32 20 20 20 20  OTWORD    12    
0ca0: 2f 2a 20 4e 6f 74 20 61 20 70 65 72 6c 20 77 6f  /* Not a perl wo
0cb0: 72 64 20 63 68 61 72 61 63 74 65 72 20 2a 2f 0a  rd character */.
0cc0: 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 44 49  #define RE_OP_DI
0cd0: 47 49 54 20 20 20 20 20 20 31 33 20 20 20 20 2f  GIT      13    /
0ce0: 2a 20 64 69 67 69 74 3a 20 20 5b 30 2d 39 5d 20  * digit:  [0-9] 
0cf0: 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50  */.#define RE_OP
0d00: 5f 4e 4f 54 44 49 47 49 54 20 20 20 31 34 20 20  _NOTDIGIT   14  
0d10: 20 20 2f 2a 20 4e 6f 74 20 61 20 64 69 67 69 74    /* Not a digit
0d20: 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f   */.#define RE_O
0d30: 50 5f 53 50 41 43 45 20 20 20 20 20 20 31 35 20  P_SPACE      15 
0d40: 20 20 20 2f 2a 20 73 70 61 63 65 3a 20 20 5b 20     /* space:  [ 
0d50: 5c 74 5c 6e 5c 72 5c 76 5c 66 5d 20 2a 2f 0a 23  \t\n\r\v\f] */.#
0d60: 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 4e 4f 54  define RE_OP_NOT
0d70: 53 50 41 43 45 20 20 20 31 36 20 20 20 20 2f 2a  SPACE   16    /*
0d80: 20 4e 6f 74 20 61 20 64 69 67 69 74 20 2a 2f 0a   Not a digit */.
0d90: 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 42 4f  #define RE_OP_BO
0da0: 55 4e 44 41 52 59 20 20 20 31 37 20 20 20 20 2f  UNDARY   17    /
0db0: 2a 20 42 6f 75 6e 64 61 72 79 20 62 65 74 77 65  * Boundary betwe
0dc0: 65 6e 20 77 6f 72 64 20 61 6e 64 20 6e 6f 6e 2d  en word and non-
0dd0: 77 6f 72 64 20 2a 2f 0a 0a 2f 2a 20 45 61 63 68  word */../* Each
0de0: 20 6f 70 63 6f 64 65 20 69 73 20 61 20 22 73 74   opcode is a "st
0df0: 61 74 65 22 20 69 6e 20 74 68 65 20 4e 46 41 20  ate" in the NFA 
0e00: 2a 2f 0a 74 79 70 65 64 65 66 20 75 6e 73 69 67  */.typedef unsig
0e10: 6e 65 64 20 73 68 6f 72 74 20 52 65 53 74 61 74  ned short ReStat
0e20: 65 4e 75 6d 62 65 72 3b 0a 0a 2f 2a 20 42 65 63  eNumber;../* Bec
0e30: 61 75 73 65 20 74 68 69 73 20 69 73 20 61 6e 20  ause this is an 
0e40: 4e 46 41 20 61 6e 64 20 6e 6f 74 20 61 20 44 46  NFA and not a DF
0e50: 41 2c 20 6d 75 6c 74 69 70 6c 65 20 73 74 61 74  A, multiple stat
0e60: 65 73 20 63 61 6e 20 62 65 20 61 63 74 69 76 65  es can be active
0e70: 20 61 74 0a 2a 2a 20 6f 6e 63 65 2e 20 20 41 6e   at.** once.  An
0e80: 20 69 6e 73 74 61 6e 63 65 20 6f 66 20 74 68 65   instance of the
0e90: 20 66 6f 6c 6c 6f 77 69 6e 67 20 6f 62 6a 65 63   following objec
0ea0: 74 20 72 65 63 6f 72 64 73 20 61 6c 6c 20 61 63  t records all ac
0eb0: 74 69 76 65 20 73 74 61 74 65 73 20 69 6e 0a 2a  tive states in.*
0ec0: 2a 20 74 68 65 20 4e 46 41 2e 20 20 54 68 65 20  * the NFA.  The 
0ed0: 69 6d 70 6c 65 6d 65 6e 74 61 74 69 6f 6e 20 69  implementation i
0ee0: 73 20 6f 70 74 69 6d 69 7a 65 64 20 66 6f 72 20  s optimized for 
0ef0: 74 68 65 20 63 6f 6d 6d 6f 6e 20 63 61 73 65 20  the common case 
0f00: 77 68 65 72 65 20 74 68 65 0a 2a 2a 20 6e 75 6d  where the.** num
0f10: 62 65 72 20 6f 66 20 61 63 74 69 76 65 73 20 73  ber of actives s
0f20: 74 61 74 65 73 20 69 73 20 73 6d 61 6c 6c 2e 0a  tates is small..
0f30: 2a 2f 0a 74 79 70 65 64 65 66 20 73 74 72 75 63  */.typedef struc
0f40: 74 20 52 65 53 74 61 74 65 53 65 74 20 7b 0a 20  t ReStateSet {. 
0f50: 20 75 6e 73 69 67 6e 65 64 20 6e 53 74 61 74 65   unsigned nState
0f60: 3b 20 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20  ;            /* 
0f70: 4e 75 6d 62 65 72 20 6f 66 20 63 75 72 72 65 6e  Number of curren
0f80: 74 20 73 74 61 74 65 73 20 2a 2f 0a 20 20 52 65  t states */.  Re
0f90: 53 74 61 74 65 4e 75 6d 62 65 72 20 2a 61 53 74  StateNumber *aSt
0fa0: 61 74 65 3b 20 20 20 20 20 20 2f 2a 20 43 75 72  ate;      /* Cur
0fb0: 72 65 6e 74 20 73 74 61 74 65 73 20 2a 2f 0a 7d  rent states */.}
0fc0: 20 52 65 53 74 61 74 65 53 65 74 3b 0a 0a 2f 2a   ReStateSet;../*
0fd0: 20 41 6e 20 69 6e 70 75 74 20 73 74 72 69 6e 67   An input string
0fe0: 20 72 65 61 64 20 6f 6e 65 20 63 68 61 72 61 63   read one charac
0ff0: 74 65 72 20 61 74 20 61 20 74 69 6d 65 2e 0a 2a  ter at a time..*
1000: 2f 0a 74 79 70 65 64 65 66 20 73 74 72 75 63 74  /.typedef struct
1010: 20 52 65 49 6e 70 75 74 20 52 65 49 6e 70 75 74   ReInput ReInput
1020: 3b 0a 73 74 72 75 63 74 20 52 65 49 6e 70 75 74  ;.struct ReInput
1030: 20 7b 0a 20 20 63 6f 6e 73 74 20 75 6e 73 69 67   {.  const unsig
1040: 6e 65 64 20 63 68 61 72 20 2a 7a 3b 20 20 2f 2a  ned char *z;  /*
1050: 20 41 6c 6c 20 74 65 78 74 20 2a 2f 0a 20 20 69   All text */.  i
1060: 6e 74 20 69 3b 20 20 20 20 20 20 20 20 20 20 20  nt i;           
1070: 20 20 20 20 20 20 20 20 2f 2a 20 4e 65 78 74 20          /* Next 
1080: 62 79 74 65 20 74 6f 20 72 65 61 64 20 2a 2f 0a  byte to read */.
1090: 20 20 69 6e 74 20 6d 78 3b 20 20 20 20 20 20 20    int mx;       
10a0: 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 4f             /* EO
10b0: 46 20 77 68 65 6e 20 69 3e 3d 6d 78 20 2a 2f 0a  F when i>=mx */.
10c0: 7d 3b 0a 0a 2f 2a 20 41 20 63 6f 6d 70 69 6c 65  };../* A compile
10d0: 64 20 4e 46 41 20 28 6f 72 20 61 6e 20 4e 46 41  d NFA (or an NFA
10e0: 20 74 68 61 74 20 69 73 20 69 6e 20 74 68 65 20   that is in the 
10f0: 70 72 6f 63 65 73 73 20 6f 66 20 62 65 69 6e 67  process of being
1100: 20 63 6f 6d 70 69 6c 65 64 29 20 69 73 0a 2a 2a   compiled) is.**
1110: 20 61 6e 20 69 6e 73 74 61 6e 63 65 20 6f 66 20   an instance of 
1120: 74 68 65 20 66 6f 6c 6c 6f 77 69 6e 67 20 6f 62  the following ob
1130: 6a 65 63 74 2e 0a 2a 2f 0a 74 79 70 65 64 65 66  ject..*/.typedef
1140: 20 73 74 72 75 63 74 20 52 65 43 6f 6d 70 69 6c   struct ReCompil
1150: 65 64 20 52 65 43 6f 6d 70 69 6c 65 64 3b 0a 73  ed ReCompiled;.s
1160: 74 72 75 63 74 20 52 65 43 6f 6d 70 69 6c 65 64  truct ReCompiled
1170: 20 7b 0a 20 20 52 65 49 6e 70 75 74 20 73 49 6e   {.  ReInput sIn
1180: 3b 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ;               
1190: 20 2f 2a 20 52 65 67 75 6c 61 72 20 65 78 70 72   /* Regular expr
11a0: 65 73 73 69 6f 6e 20 74 65 78 74 20 2a 2f 0a 20  ession text */. 
11b0: 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 45 72   const char *zEr
11c0: 72 3b 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20  r;           /* 
11d0: 45 72 72 6f 72 20 6d 65 73 73 61 67 65 20 74 6f  Error message to
11e0: 20 72 65 74 75 72 6e 20 2a 2f 0a 20 20 63 68 61   return */.  cha
11f0: 72 20 2a 61 4f 70 3b 20 20 20 20 20 20 20 20 20  r *aOp;         
1200: 20 20 20 20 20 20 20 20 20 2f 2a 20 4f 70 65 72           /* Oper
1210: 61 74 6f 72 73 20 66 6f 72 20 74 68 65 20 76 69  ators for the vi
1220: 72 74 75 61 6c 20 6d 61 63 68 69 6e 65 20 2a 2f  rtual machine */
1230: 0a 20 20 69 6e 74 20 2a 61 41 72 67 3b 20 20 20  .  int *aArg;   
1240: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 2f                 /
1250: 2a 20 41 72 67 75 6d 65 6e 74 73 20 74 6f 20 65  * Arguments to e
1260: 61 63 68 20 6f 70 65 72 61 74 6f 72 20 2a 2f 0a  ach operator */.
1270: 20 20 75 6e 73 69 67 6e 65 64 20 28 2a 78 4e 65    unsigned (*xNe
1280: 78 74 43 68 61 72 29 28 52 65 49 6e 70 75 74 2a  xtChar)(ReInput*
1290: 29 3b 20 20 2f 2a 20 4e 65 78 74 20 63 68 61 72  );  /* Next char
12a0: 61 63 74 65 72 20 66 75 6e 63 74 69 6f 6e 20 2a  acter function *
12b0: 2f 0a 20 20 63 68 61 72 20 7a 49 6e 69 74 5b 31  /.  char zInit[1
12c0: 32 5d 3b 20 20 20 20 20 20 20 20 20 20 20 20 20  2];             
12d0: 2f 2a 20 49 6e 69 74 69 61 6c 20 74 65 78 74 20  /* Initial text 
12e0: 74 6f 20 6d 61 74 63 68 20 2a 2f 0a 20 20 69 6e  to match */.  in
12f0: 74 20 6e 49 6e 69 74 3b 20 20 20 20 20 20 20 20  t nInit;        
1300: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 4e 75 6d            /* Num
1310: 62 65 72 20 6f 66 20 63 68 61 72 61 63 74 65 72  ber of character
1320: 73 20 69 6e 20 7a 49 6e 69 74 20 2a 2f 0a 20 20  s in zInit */.  
1330: 75 6e 73 69 67 6e 65 64 20 6e 53 74 61 74 65 3b  unsigned nState;
1340: 20 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20 4e              /* N
1350: 75 6d 62 65 72 20 6f 66 20 65 6e 74 72 69 65 73  umber of entries
1360: 20 69 6e 20 61 4f 70 5b 5d 20 61 6e 64 20 61 41   in aOp[] and aA
1370: 72 67 5b 5d 20 2a 2f 0a 20 20 75 6e 73 69 67 6e  rg[] */.  unsign
1380: 65 64 20 6e 41 6c 6c 6f 63 3b 20 20 20 20 20 20  ed nAlloc;      
1390: 20 20 20 20 20 20 2f 2a 20 53 6c 6f 74 73 20 61        /* Slots a
13a0: 6c 6c 6f 63 61 74 65 64 20 66 6f 72 20 61 4f 70  llocated for aOp
13b0: 5b 5d 20 61 6e 64 20 61 41 72 67 5b 5d 20 2a 2f  [] and aArg[] */
13c0: 0a 7d 3b 0a 0a 2f 2a 20 41 64 64 20 61 20 73 74  .};../* Add a st
13d0: 61 74 65 20 74 6f 20 74 68 65 20 67 69 76 65 6e  ate to the given
13e0: 20 73 74 61 74 65 20 73 65 74 20 69 66 20 69 74   state set if it
13f0: 20 69 73 20 6e 6f 74 20 61 6c 72 65 61 64 79 20   is not already 
1400: 74 68 65 72 65 20 2a 2f 0a 73 74 61 74 69 63 20  there */.static 
1410: 76 6f 69 64 20 72 65 5f 61 64 64 5f 73 74 61 74  void re_add_stat
1420: 65 28 52 65 53 74 61 74 65 53 65 74 20 2a 70 53  e(ReStateSet *pS
1430: 65 74 2c 20 69 6e 74 20 6e 65 77 53 74 61 74 65  et, int newState
1440: 29 7b 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 3b  ){.  unsigned i;
1450: 0a 20 20 66 6f 72 28 69 3d 30 3b 20 69 3c 70 53  .  for(i=0; i<pS
1460: 65 74 2d 3e 6e 53 74 61 74 65 3b 20 69 2b 2b 29  et->nState; i++)
1470: 20 69 66 28 20 70 53 65 74 2d 3e 61 53 74 61 74   if( pSet->aStat
1480: 65 5b 69 5d 3d 3d 6e 65 77 53 74 61 74 65 20 29  e[i]==newState )
1490: 20 72 65 74 75 72 6e 3b 0a 20 20 70 53 65 74 2d   return;.  pSet-
14a0: 3e 61 53 74 61 74 65 5b 70 53 65 74 2d 3e 6e 53  >aState[pSet->nS
14b0: 74 61 74 65 2b 2b 5d 20 3d 20 6e 65 77 53 74 61  tate++] = newSta
14c0: 74 65 3b 0a 7d 0a 0a 2f 2a 20 45 78 74 72 61 63  te;.}../* Extrac
14d0: 74 20 74 68 65 20 6e 65 78 74 20 75 6e 69 63 6f  t the next unico
14e0: 64 65 20 63 68 61 72 61 63 74 65 72 20 66 72 6f  de character fro
14f0: 6d 20 2a 70 7a 49 6e 20 61 6e 64 20 72 65 74 75  m *pzIn and retu
1500: 72 6e 20 69 74 2e 20 20 41 64 76 61 6e 63 65 0a  rn it.  Advance.
1510: 2a 2a 20 2a 70 7a 49 6e 20 74 6f 20 74 68 65 20  ** *pzIn to the 
1520: 66 69 72 73 74 20 62 79 74 65 20 70 61 73 74 20  first byte past 
1530: 74 68 65 20 65 6e 64 20 6f 66 20 74 68 65 20 63  the end of the c
1540: 68 61 72 61 63 74 65 72 20 72 65 74 75 72 6e 65  haracter returne
1550: 64 2e 20 20 54 6f 0a 2a 2a 20 62 65 20 63 6c 65  d.  To.** be cle
1560: 61 72 3a 20 20 74 68 69 73 20 72 6f 75 74 69 6e  ar:  this routin
1570: 65 20 63 6f 6e 76 65 72 74 73 20 75 74 66 38 20  e converts utf8 
1580: 74 6f 20 75 6e 69 63 6f 64 65 2e 20 20 54 68 69  to unicode.  Thi
1590: 73 20 72 6f 75 74 69 6e 65 20 69 73 20 0a 2a 2a  s routine is .**
15a0: 20 6f 70 74 69 6d 69 7a 65 64 20 66 6f 72 20 74   optimized for t
15b0: 68 65 20 63 6f 6d 6d 6f 6e 20 63 61 73 65 20 77  he common case w
15c0: 68 65 72 65 20 74 68 65 20 6e 65 78 74 20 63 68  here the next ch
15d0: 61 72 61 63 74 65 72 20 69 73 20 61 20 73 69 6e  aracter is a sin
15e0: 67 6c 65 20 62 79 74 65 2e 0a 2a 2f 0a 73 74 61  gle byte..*/.sta
15f0: 74 69 63 20 75 6e 73 69 67 6e 65 64 20 72 65 5f  tic unsigned re_
1600: 6e 65 78 74 5f 63 68 61 72 28 52 65 49 6e 70 75  next_char(ReInpu
1610: 74 20 2a 70 29 7b 0a 20 20 75 6e 73 69 67 6e 65  t *p){.  unsigne
1620: 64 20 63 3b 0a 20 20 69 66 28 20 70 2d 3e 69 3e  d c;.  if( p->i>
1630: 3d 70 2d 3e 6d 78 20 29 20 72 65 74 75 72 6e 20  =p->mx ) return 
1640: 30 3b 0a 20 20 63 20 3d 20 70 2d 3e 7a 5b 70 2d  0;.  c = p->z[p-
1650: 3e 69 2b 2b 5d 3b 0a 20 20 69 66 28 20 63 3e 3d  >i++];.  if( c>=
1660: 30 78 38 30 20 29 7b 0a 20 20 20 20 69 66 28 20  0x80 ){.    if( 
1670: 28 63 26 30 78 65 30 29 3d 3d 30 78 63 30 20 26  (c&0xe0)==0xc0 &
1680: 26 20 70 2d 3e 69 3c 70 2d 3e 6d 78 20 26 26 20  & p->i<p->mx && 
1690: 28 70 2d 3e 7a 5b 70 2d 3e 69 5d 26 30 78 63 30  (p->z[p->i]&0xc0
16a0: 29 3d 3d 30 78 38 30 20 29 7b 0a 20 20 20 20 20  )==0x80 ){.     
16b0: 20 63 20 3d 20 28 63 26 30 78 31 66 29 3c 3c 36   c = (c&0x1f)<<6
16c0: 20 7c 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 2b 5d   | (p->z[p->i++]
16d0: 26 30 78 33 66 29 3b 0a 20 20 20 20 20 20 69 66  &0x3f);.      if
16e0: 28 20 63 3c 30 78 38 30 20 29 20 63 20 3d 20 30  ( c<0x80 ) c = 0
16f0: 78 66 66 66 64 3b 0a 20 20 20 20 7d 65 6c 73 65  xfffd;.    }else
1700: 20 69 66 28 20 28 63 26 30 78 66 30 29 3d 3d 30   if( (c&0xf0)==0
1710: 78 65 30 20 26 26 20 70 2d 3e 69 2b 31 3c 70 2d  xe0 && p->i+1<p-
1720: 3e 6d 78 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e  >mx && (p->z[p->
1730: 69 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 0a 20  i]&0xc0)==0x80. 
1740: 20 20 20 20 20 20 20 20 20 20 26 26 20 28 70 2d            && (p-
1750: 3e 7a 5b 70 2d 3e 69 2b 31 5d 26 30 78 63 30 29  >z[p->i+1]&0xc0)
1760: 3d 3d 30 78 38 30 20 29 7b 0a 20 20 20 20 20 20  ==0x80 ){.      
1770: 63 20 3d 20 28 63 26 30 78 30 66 29 3c 3c 31 32  c = (c&0x0f)<<12
1780: 20 7c 20 28 28 70 2d 3e 7a 5b 70 2d 3e 69 5d 26   | ((p->z[p->i]&
1790: 30 78 33 66 29 3c 3c 36 29 20 7c 20 28 70 2d 3e  0x3f)<<6) | (p->
17a0: 7a 5b 70 2d 3e 69 2b 31 5d 26 30 78 33 66 29 3b  z[p->i+1]&0x3f);
17b0: 0a 20 20 20 20 20 20 70 2d 3e 69 20 2b 3d 20 32  .      p->i += 2
17c0: 3b 0a 20 20 20 20 20 20 69 66 28 20 63 3c 3d 30  ;.      if( c<=0
17d0: 78 33 66 66 20 7c 7c 20 28 63 3e 3d 30 78 64 38  x3ff || (c>=0xd8
17e0: 30 30 20 26 26 20 63 3c 3d 30 78 64 66 66 66 29  00 && c<=0xdfff)
17f0: 20 29 20 63 20 3d 20 30 78 66 66 66 64 3b 0a 20   ) c = 0xfffd;. 
1800: 20 20 20 7d 65 6c 73 65 20 69 66 28 20 28 63 26     }else if( (c&
1810: 30 78 66 38 29 3d 3d 30 78 66 30 20 26 26 20 70  0xf8)==0xf0 && p
1820: 2d 3e 69 2b 33 3c 70 2d 3e 6d 78 20 26 26 20 28  ->i+3<p->mx && (
1830: 70 2d 3e 7a 5b 70 2d 3e 69 5d 26 30 78 63 30 29  p->z[p->i]&0xc0)
1840: 3d 3d 30 78 38 30 0a 20 20 20 20 20 20 20 20 20  ==0x80.         
1850: 20 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b    && (p->z[p->i+
1860: 31 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 20 26  1]&0xc0)==0x80 &
1870: 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 32 5d 26  & (p->z[p->i+2]&
1880: 30 78 63 30 29 3d 3d 30 78 38 30 20 29 7b 0a 20  0xc0)==0x80 ){. 
1890: 20 20 20 20 20 63 20 3d 20 28 63 26 30 78 30 37       c = (c&0x07
18a0: 29 3c 3c 31 38 20 7c 20 28 28 70 2d 3e 7a 5b 70  )<<18 | ((p->z[p
18b0: 2d 3e 69 5d 26 30 78 33 66 29 3c 3c 31 32 29 20  ->i]&0x3f)<<12) 
18c0: 7c 20 28 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 31 5d  | ((p->z[p->i+1]
18d0: 26 30 78 33 66 29 3c 3c 36 29 0a 20 20 20 20 20  &0x3f)<<6).     
18e0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
18f0: 20 20 7c 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 32    | (p->z[p->i+2
1900: 5d 26 30 78 33 66 29 3b 0a 20 20 20 20 20 20 70  ]&0x3f);.      p
1910: 2d 3e 69 20 2b 3d 20 33 3b 0a 20 20 20 20 20 20  ->i += 3;.      
1920: 69 66 28 20 63 3c 3d 30 78 66 66 66 66 20 7c 7c  if( c<=0xffff ||
1930: 20 63 3e 30 78 31 30 66 66 66 66 20 29 20 63 20   c>0x10ffff ) c 
1940: 3d 20 30 78 66 66 66 64 3b 0a 20 20 20 20 7d 65  = 0xfffd;.    }e
1950: 6c 73 65 7b 0a 20 20 20 20 20 20 63 20 3d 20 30  lse{.      c = 0
1960: 78 66 66 66 64 3b 0a 20 20 20 20 7d 0a 20 20 7d  xfffd;.    }.  }
1970: 0a 20 20 72 65 74 75 72 6e 20 63 3b 0a 7d 0a 73  .  return c;.}.s
1980: 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20 72  tatic unsigned r
1990: 65 5f 6e 65 78 74 5f 63 68 61 72 5f 6e 6f 63 61  e_next_char_noca
19a0: 73 65 28 52 65 49 6e 70 75 74 20 2a 70 29 7b 0a  se(ReInput *p){.
19b0: 20 20 75 6e 73 69 67 6e 65 64 20 63 20 3d 20 72    unsigned c = r
19c0: 65 5f 6e 65 78 74 5f 63 68 61 72 28 70 29 3b 0a  e_next_char(p);.
19d0: 20 20 69 66 28 20 63 3e 3d 27 41 27 20 26 26 20    if( c>='A' && 
19e0: 63 3c 3d 27 5a 27 20 29 20 63 20 2b 3d 20 27 61  c<='Z' ) c += 'a
19f0: 27 20 2d 20 27 41 27 3b 0a 20 20 72 65 74 75 72  ' - 'A';.  retur
1a00: 6e 20 63 3b 0a 7d 0a 0a 2f 2a 20 52 65 74 75 72  n c;.}../* Retur
1a10: 6e 20 74 72 75 65 20 69 66 20 63 20 69 73 20 61  n true if c is a
1a20: 20 70 65 72 6c 20 22 77 6f 72 64 22 20 63 68 61   perl "word" cha
1a30: 72 61 63 74 65 72 3a 20 20 5b 41 2d 5a 61 2d 7a  racter:  [A-Za-z
1a40: 30 2d 39 5f 5d 20 2a 2f 0a 73 74 61 74 69 63 20  0-9_] */.static 
1a50: 69 6e 74 20 72 65 5f 77 6f 72 64 5f 63 68 61 72  int re_word_char
1a60: 28 69 6e 74 20 63 29 7b 0a 20 20 72 65 74 75 72  (int c){.  retur
1a70: 6e 20 28 63 3e 3d 27 30 27 20 26 26 20 63 3c 3d  n (c>='0' && c<=
1a80: 27 39 27 29 20 7c 7c 20 28 63 3e 3d 27 61 27 20  '9') || (c>='a' 
1a90: 26 26 20 63 3c 3d 27 7a 27 29 0a 20 20 20 20 20  && c<='z').     
1aa0: 20 7c 7c 20 28 63 3e 3d 27 41 27 20 26 26 20 63   || (c>='A' && c
1ab0: 3c 3d 27 5a 27 29 20 7c 7c 20 63 3d 3d 27 5f 27  <='Z') || c=='_'
1ac0: 3b 0a 7d 0a 0a 2f 2a 20 52 65 74 75 72 6e 20 74  ;.}../* Return t
1ad0: 72 75 65 20 69 66 20 63 20 69 73 20 61 20 22 64  rue if c is a "d
1ae0: 69 67 69 74 22 20 63 68 61 72 61 63 74 65 72 3a  igit" character:
1af0: 20 20 5b 30 2d 39 5d 20 2a 2f 0a 73 74 61 74 69    [0-9] */.stati
1b00: 63 20 69 6e 74 20 72 65 5f 64 69 67 69 74 5f 63  c int re_digit_c
1b10: 68 61 72 28 69 6e 74 20 63 29 7b 0a 20 20 72 65  har(int c){.  re
1b20: 74 75 72 6e 20 28 63 3e 3d 27 30 27 20 26 26 20  turn (c>='0' && 
1b30: 63 3c 3d 27 39 27 29 3b 0a 7d 0a 0a 2f 2a 20 52  c<='9');.}../* R
1b40: 65 74 75 72 6e 20 74 72 75 65 20 69 66 20 63 20  eturn true if c 
1b50: 69 73 20 61 20 70 65 72 6c 20 22 73 70 61 63 65  is a perl "space
1b60: 22 20 63 68 61 72 61 63 74 65 72 3a 20 20 5b 20  " character:  [ 
1b70: 5c 74 5c 72 5c 6e 5c 76 5c 66 5d 20 2a 2f 0a 73  \t\r\n\v\f] */.s
1b80: 74 61 74 69 63 20 69 6e 74 20 72 65 5f 73 70 61  tatic int re_spa
1b90: 63 65 5f 63 68 61 72 28 69 6e 74 20 63 29 7b 0a  ce_char(int c){.
1ba0: 20 20 72 65 74 75 72 6e 20 63 3d 3d 27 20 27 20    return c==' ' 
1bb0: 7c 7c 20 63 3d 3d 27 5c 74 27 20 7c 7c 20 63 3d  || c=='\t' || c=
1bc0: 3d 27 5c 6e 27 20 7c 7c 20 63 3d 3d 27 5c 72 27  ='\n' || c=='\r'
1bd0: 20 7c 7c 20 63 3d 3d 27 5c 76 27 20 7c 7c 20 63   || c=='\v' || c
1be0: 3d 3d 27 5c 66 27 3b 0a 7d 0a 0a 2f 2a 20 52 75  =='\f';.}../* Ru
1bf0: 6e 20 61 20 63 6f 6d 70 69 6c 65 64 20 72 65 67  n a compiled reg
1c00: 75 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20  ular expression 
1c10: 6f 6e 20 74 68 65 20 7a 65 72 6f 2d 74 65 72 6d  on the zero-term
1c20: 69 6e 61 74 65 64 20 69 6e 70 75 74 0a 2a 2a 20  inated input.** 
1c30: 73 74 72 69 6e 67 20 7a 49 6e 5b 5d 2e 20 20 52  string zIn[].  R
1c40: 65 74 75 72 6e 20 74 72 75 65 20 6f 6e 20 61 20  eturn true on a 
1c50: 6d 61 74 63 68 20 61 6e 64 20 66 61 6c 73 65 20  match and false 
1c60: 69 66 20 74 68 65 72 65 20 69 73 20 6e 6f 20 6d  if there is no m
1c70: 61 74 63 68 2e 0a 2a 2f 0a 69 6e 74 20 72 65 5f  atch..*/.int re_
1c80: 6d 61 74 63 68 28 52 65 43 6f 6d 70 69 6c 65 64  match(ReCompiled
1c90: 20 2a 70 52 65 2c 20 63 6f 6e 73 74 20 75 6e 73   *pRe, const uns
1ca0: 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 49 6e 2c  igned char *zIn,
1cb0: 20 69 6e 74 20 6e 49 6e 29 7b 0a 20 20 52 65 53   int nIn){.  ReS
1cc0: 74 61 74 65 53 65 74 20 61 53 74 61 74 65 53 65  tateSet aStateSe
1cd0: 74 5b 32 5d 2c 20 2a 70 54 68 69 73 2c 20 2a 70  t[2], *pThis, *p
1ce0: 4e 65 78 74 3b 0a 20 20 52 65 53 74 61 74 65 4e  Next;.  ReStateN
1cf0: 75 6d 62 65 72 20 61 53 70 61 63 65 5b 31 30 30  umber aSpace[100
1d00: 5d 3b 0a 20 20 52 65 53 74 61 74 65 4e 75 6d 62  ];.  ReStateNumb
1d10: 65 72 20 2a 70 54 6f 46 72 65 65 3b 0a 20 20 75  er *pToFree;.  u
1d20: 6e 73 69 67 6e 65 64 20 69 6e 74 20 69 20 3d 20  nsigned int i = 
1d30: 30 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e  0;.  unsigned in
1d40: 74 20 69 53 77 61 70 20 3d 20 30 3b 0a 20 20 69  t iSwap = 0;.  i
1d50: 6e 74 20 63 20 3d 20 52 45 5f 45 4f 46 2b 31 3b  nt c = RE_EOF+1;
1d60: 0a 20 20 69 6e 74 20 63 50 72 65 76 20 3d 20 30  .  int cPrev = 0
1d70: 3b 0a 20 20 69 6e 74 20 72 63 20 3d 20 30 3b 0a  ;.  int rc = 0;.
1d80: 20 20 52 65 49 6e 70 75 74 20 69 6e 3b 0a 0a 20    ReInput in;.. 
1d90: 20 69 6e 2e 7a 20 3d 20 7a 49 6e 3b 0a 20 20 69   in.z = zIn;.  i
1da0: 6e 2e 69 20 3d 20 30 3b 0a 20 20 69 6e 2e 6d 78  n.i = 0;.  in.mx
1db0: 20 3d 20 6e 49 6e 3e 3d 30 20 3f 20 6e 49 6e 20   = nIn>=0 ? nIn 
1dc0: 3a 20 73 74 72 6c 65 6e 28 28 63 68 61 72 20 63  : strlen((char c
1dd0: 6f 6e 73 74 2a 29 7a 49 6e 29 3b 0a 0a 20 20 2f  onst*)zIn);..  /
1de0: 2a 20 4c 6f 6f 6b 20 66 6f 72 20 74 68 65 20 69  * Look for the i
1df0: 6e 69 74 69 61 6c 20 70 72 65 66 69 78 20 6d 61  nitial prefix ma
1e00: 74 63 68 2c 20 69 66 20 74 68 65 72 65 20 69 73  tch, if there is
1e10: 20 6f 6e 65 2e 20 2a 2f 0a 20 20 69 66 28 20 70   one. */.  if( p
1e20: 52 65 2d 3e 6e 49 6e 69 74 20 29 7b 0a 20 20 20  Re->nInit ){.   
1e30: 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 78   unsigned char x
1e40: 20 3d 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 30 5d   = pRe->zInit[0]
1e50: 3b 0a 20 20 20 20 77 68 69 6c 65 28 20 69 6e 2e  ;.    while( in.
1e60: 69 2b 70 52 65 2d 3e 6e 49 6e 69 74 3c 3d 69 6e  i+pRe->nInit<=in
1e70: 2e 6d 78 20 0a 20 20 20 20 20 20 20 20 26 26 20  .mx .        && 
1e80: 28 7a 49 6e 5b 69 6e 2e 69 5d 21 3d 78 20 7c 7c  (zIn[in.i]!=x ||
1e90: 20 73 74 72 6e 63 6d 70 28 7a 49 6e 2b 69 6e 2e   strncmp(zIn+in.
1ea0: 69 2c 20 70 52 65 2d 3e 7a 49 6e 69 74 2c 20 70  i, pRe->zInit, p
1eb0: 52 65 2d 3e 6e 49 6e 69 74 29 21 3d 30 29 0a 20  Re->nInit)!=0). 
1ec0: 20 20 20 29 7b 0a 20 20 20 20 20 20 69 6e 2e 69     ){.      in.i
1ed0: 2b 2b 3b 0a 20 20 20 20 7d 0a 20 20 20 20 69 66  ++;.    }.    if
1ee0: 28 20 69 6e 2e 69 2b 70 52 65 2d 3e 6e 49 6e 69  ( in.i+pRe->nIni
1ef0: 74 3e 69 6e 2e 6d 78 20 29 20 72 65 74 75 72 6e  t>in.mx ) return
1f00: 20 30 3b 0a 20 20 7d 0a 0a 20 20 69 66 28 20 70   0;.  }..  if( p
1f10: 52 65 2d 3e 6e 53 74 61 74 65 3c 3d 28 73 69 7a  Re->nState<=(siz
1f20: 65 6f 66 28 61 53 70 61 63 65 29 2f 28 73 69 7a  eof(aSpace)/(siz
1f30: 65 6f 66 28 61 53 70 61 63 65 5b 30 5d 29 2a 32  eof(aSpace[0])*2
1f40: 29 29 20 29 7b 0a 20 20 20 20 70 54 6f 46 72 65  )) ){.    pToFre
1f50: 65 20 3d 20 30 3b 0a 20 20 20 20 61 53 74 61 74  e = 0;.    aStat
1f60: 65 53 65 74 5b 30 5d 2e 61 53 74 61 74 65 20 3d  eSet[0].aState =
1f70: 20 61 53 70 61 63 65 3b 0a 20 20 7d 65 6c 73 65   aSpace;.  }else
1f80: 7b 0a 20 20 20 20 70 54 6f 46 72 65 65 20 3d 20  {.    pToFree = 
1f90: 73 71 6c 69 74 65 33 5f 6d 61 6c 6c 6f 63 28 20  sqlite3_malloc( 
1fa0: 73 69 7a 65 6f 66 28 52 65 53 74 61 74 65 4e 75  sizeof(ReStateNu
1fb0: 6d 62 65 72 29 2a 32 2a 70 52 65 2d 3e 6e 53 74  mber)*2*pRe->nSt
1fc0: 61 74 65 20 29 3b 0a 20 20 20 20 69 66 28 20 70  ate );.    if( p
1fd0: 54 6f 46 72 65 65 3d 3d 30 20 29 20 72 65 74 75  ToFree==0 ) retu
1fe0: 72 6e 20 2d 31 3b 0a 20 20 20 20 61 53 74 61 74  rn -1;.    aStat
1ff0: 65 53 65 74 5b 30 5d 2e 61 53 74 61 74 65 20 3d  eSet[0].aState =
2000: 20 70 54 6f 46 72 65 65 3b 0a 20 20 7d 0a 20 20   pToFree;.  }.  
2010: 61 53 74 61 74 65 53 65 74 5b 31 5d 2e 61 53 74  aStateSet[1].aSt
2020: 61 74 65 20 3d 20 26 61 53 74 61 74 65 53 65 74  ate = &aStateSet
2030: 5b 30 5d 2e 61 53 74 61 74 65 5b 70 52 65 2d 3e  [0].aState[pRe->
2040: 6e 53 74 61 74 65 5d 3b 0a 20 20 70 4e 65 78 74  nState];.  pNext
2050: 20 3d 20 26 61 53 74 61 74 65 53 65 74 5b 31 5d   = &aStateSet[1]
2060: 3b 0a 20 20 70 4e 65 78 74 2d 3e 6e 53 74 61 74  ;.  pNext->nStat
2070: 65 20 3d 20 30 3b 0a 20 20 72 65 5f 61 64 64 5f  e = 0;.  re_add_
2080: 73 74 61 74 65 28 70 4e 65 78 74 2c 20 30 29 3b  state(pNext, 0);
2090: 0a 20 20 77 68 69 6c 65 28 20 63 21 3d 52 45 5f  .  while( c!=RE_
20a0: 45 4f 46 20 26 26 20 70 4e 65 78 74 2d 3e 6e 53  EOF && pNext->nS
20b0: 74 61 74 65 3e 30 20 29 7b 0a 20 20 20 20 63 50  tate>0 ){.    cP
20c0: 72 65 76 20 3d 20 63 3b 0a 20 20 20 20 63 20 3d  rev = c;.    c =
20d0: 20 70 52 65 2d 3e 78 4e 65 78 74 43 68 61 72 28   pRe->xNextChar(
20e0: 26 69 6e 29 3b 0a 20 20 20 20 70 54 68 69 73 20  &in);.    pThis 
20f0: 3d 20 70 4e 65 78 74 3b 0a 20 20 20 20 70 4e 65  = pNext;.    pNe
2100: 78 74 20 3d 20 26 61 53 74 61 74 65 53 65 74 5b  xt = &aStateSet[
2110: 69 53 77 61 70 5d 3b 0a 20 20 20 20 69 53 77 61  iSwap];.    iSwa
2120: 70 20 3d 20 31 20 2d 20 69 53 77 61 70 3b 0a 20  p = 1 - iSwap;. 
2130: 20 20 20 70 4e 65 78 74 2d 3e 6e 53 74 61 74 65     pNext->nState
2140: 20 3d 20 30 3b 0a 20 20 20 20 66 6f 72 28 69 3d   = 0;.    for(i=
2150: 30 3b 20 69 3c 70 54 68 69 73 2d 3e 6e 53 74 61  0; i<pThis->nSta
2160: 74 65 3b 20 69 2b 2b 29 7b 0a 20 20 20 20 20 20  te; i++){.      
2170: 69 6e 74 20 78 20 3d 20 70 54 68 69 73 2d 3e 61  int x = pThis->a
2180: 53 74 61 74 65 5b 69 5d 3b 0a 20 20 20 20 20 20  State[i];.      
2190: 73 77 69 74 63 68 28 20 70 52 65 2d 3e 61 4f 70  switch( pRe->aOp
21a0: 5b 78 5d 20 29 7b 0a 20 20 20 20 20 20 20 20 63  [x] ){.        c
21b0: 61 73 65 20 52 45 5f 4f 50 5f 4d 41 54 43 48 3a  ase RE_OP_MATCH:
21c0: 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28   {.          if(
21d0: 20 70 52 65 2d 3e 61 41 72 67 5b 78 5d 3d 3d 63   pRe->aArg[x]==c
21e0: 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28   ) re_add_state(
21f0: 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20  pNext, x+1);.   
2200: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20         break;.  
2210: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
2220: 63 61 73 65 20 52 45 5f 4f 50 5f 41 4e 59 3a 20  case RE_OP_ANY: 
2230: 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61  {.          re_a
2240: 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20  dd_state(pNext, 
2250: 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20  x+1);.          
2260: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d  break;.        }
2270: 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45  .        case RE
2280: 5f 4f 50 5f 57 4f 52 44 3a 20 7b 0a 20 20 20 20  _OP_WORD: {.    
2290: 20 20 20 20 20 20 69 66 28 20 72 65 5f 77 6f 72        if( re_wor
22a0: 64 5f 63 68 61 72 28 63 29 20 29 20 72 65 5f 61  d_char(c) ) re_a
22b0: 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20  dd_state(pNext, 
22c0: 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20  x+1);.          
22d0: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d  break;.        }
22e0: 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45  .        case RE
22f0: 5f 4f 50 5f 4e 4f 54 57 4f 52 44 3a 20 7b 0a 20  _OP_NOTWORD: {. 
2300: 20 20 20 20 20 20 20 20 20 69 66 28 20 21 72 65           if( !re
2310: 5f 77 6f 72 64 5f 63 68 61 72 28 63 29 20 29 20  _word_char(c) ) 
2320: 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65  re_add_state(pNe
2330: 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20  xt, x+1);.      
2340: 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20      break;.     
2350: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73     }.        cas
2360: 65 20 52 45 5f 4f 50 5f 44 49 47 49 54 3a 20 7b  e RE_OP_DIGIT: {
2370: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 72  .          if( r
2380: 65 5f 64 69 67 69 74 5f 63 68 61 72 28 63 29 20  e_digit_char(c) 
2390: 29 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70  ) re_add_state(p
23a0: 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20  Next, x+1);.    
23b0: 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20        break;.   
23c0: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63       }.        c
23d0: 61 73 65 20 52 45 5f 4f 50 5f 4e 4f 54 44 49 47  ase RE_OP_NOTDIG
23e0: 49 54 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20  IT: {.          
23f0: 69 66 28 20 21 72 65 5f 64 69 67 69 74 5f 63 68  if( !re_digit_ch
2400: 61 72 28 63 29 20 29 20 72 65 5f 61 64 64 5f 73  ar(c) ) re_add_s
2410: 74 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29  tate(pNext, x+1)
2420: 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61  ;.          brea
2430: 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20  k;.        }.   
2440: 20 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f       case RE_OP_
2450: 53 50 41 43 45 3a 20 7b 0a 20 20 20 20 20 20 20  SPACE: {.       
2460: 20 20 20 69 66 28 20 72 65 5f 73 70 61 63 65 5f     if( re_space_
2470: 63 68 61 72 28 63 29 20 29 20 72 65 5f 61 64 64  char(c) ) re_add
2480: 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20 78 2b  _state(pNext, x+
2490: 31 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72  1);.          br
24a0: 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20  eak;.        }. 
24b0: 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f 4f         case RE_O
24c0: 50 5f 4e 4f 54 53 50 41 43 45 3a 20 7b 0a 20 20  P_NOTSPACE: {.  
24d0: 20 20 20 20 20 20 20 20 69 66 28 20 21 72 65 5f          if( !re_
24e0: 73 70 61 63 65 5f 63 68 61 72 28 63 29 20 29 20  space_char(c) ) 
24f0: 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65  re_add_state(pNe
2500: 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20  xt, x+1);.      
2510: 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20      break;.     
2520: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73     }.        cas
2530: 65 20 52 45 5f 4f 50 5f 42 4f 55 4e 44 41 52 59  e RE_OP_BOUNDARY
2540: 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66  : {.          if
2550: 28 20 72 65 5f 77 6f 72 64 5f 63 68 61 72 28 63  ( re_word_char(c
2560: 29 21 3d 72 65 5f 77 6f 72 64 5f 63 68 61 72 28  )!=re_word_char(
2570: 63 50 72 65 76 29 20 29 20 72 65 5f 61 64 64 5f  cPrev) ) re_add_
2580: 73 74 61 74 65 28 70 54 68 69 73 2c 20 78 2b 31  state(pThis, x+1
2590: 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72 65  );.          bre
25a0: 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20  ak;.        }.  
25b0: 20 20 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50        case RE_OP
25c0: 5f 41 4e 59 53 54 41 52 3a 20 7b 0a 20 20 20 20  _ANYSTAR: {.    
25d0: 20 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74 61        re_add_sta
25e0: 74 65 28 70 4e 65 78 74 2c 20 78 29 3b 0a 20 20  te(pNext, x);.  
25f0: 20 20 20 20 20 20 20 20 72 65 5f 61 64 64 5f 73          re_add_s
2600: 74 61 74 65 28 70 54 68 69 73 2c 20 78 2b 31 29  tate(pThis, x+1)
2610: 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61  ;.          brea
2620: 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20  k;.        }.   
2630: 20 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f       case RE_OP_
2640: 46 4f 52 4b 3a 20 7b 0a 20 20 20 20 20 20 20 20  FORK: {.        
2650: 20 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70    re_add_state(p
2660: 54 68 69 73 2c 20 78 2b 70 52 65 2d 3e 61 41 72  This, x+pRe->aAr
2670: 67 5b 78 5d 29 3b 0a 20 20 20 20 20 20 20 20 20  g[x]);.         
2680: 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 54   re_add_state(pT
2690: 68 69 73 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20  his, x+1);.     
26a0: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
26b0: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61      }.        ca
26c0: 73 65 20 52 45 5f 4f 50 5f 47 4f 54 4f 3a 20 7b  se RE_OP_GOTO: {
26d0: 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 64  .          re_ad
26e0: 64 5f 73 74 61 74 65 28 70 54 68 69 73 2c 20 78  d_state(pThis, x
26f0: 2b 70 52 65 2d 3e 61 41 72 67 5b 78 5d 29 3b 0a  +pRe->aArg[x]);.
2700: 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b            break;
2710: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20  .        }.     
2720: 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 41 43     case RE_OP_AC
2730: 43 45 50 54 3a 20 7b 0a 20 20 20 20 20 20 20 20  CEPT: {.        
2740: 20 20 72 63 20 3d 20 31 3b 0a 20 20 20 20 20 20    rc = 1;.      
2750: 20 20 20 20 67 6f 74 6f 20 72 65 5f 6d 61 74 63      goto re_matc
2760: 68 5f 65 6e 64 3b 0a 20 20 20 20 20 20 20 20 7d  h_end;.        }
2770: 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45  .        case RE
2780: 5f 4f 50 5f 43 43 5f 49 4e 43 3a 0a 20 20 20 20  _OP_CC_INC:.    
2790: 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 43      case RE_OP_C
27a0: 43 5f 45 58 43 3a 20 7b 0a 20 20 20 20 20 20 20  C_EXC: {.       
27b0: 20 20 20 69 6e 74 20 6a 20 3d 20 31 3b 0a 20 20     int j = 1;.  
27c0: 20 20 20 20 20 20 20 20 69 6e 74 20 6e 20 3d 20          int n = 
27d0: 70 52 65 2d 3e 61 41 72 67 5b 78 5d 3b 0a 20 20  pRe->aArg[x];.  
27e0: 20 20 20 20 20 20 20 20 69 6e 74 20 68 69 74 20          int hit 
27f0: 3d 20 30 3b 0a 20 20 20 20 20 20 20 20 20 20 66  = 0;.          f
2800: 6f 72 28 6a 3d 31 3b 20 6a 3e 30 20 26 26 20 6a  or(j=1; j>0 && j
2810: 3c 6e 3b 20 6a 2b 2b 29 7b 0a 20 20 20 20 20 20  <n; j++){.      
2820: 20 20 20 20 20 20 69 66 28 20 70 52 65 2d 3e 61        if( pRe->a
2830: 4f 70 5b 78 2b 6a 5d 3d 3d 52 45 5f 4f 50 5f 43  Op[x+j]==RE_OP_C
2840: 43 5f 56 41 4c 55 45 20 29 7b 0a 20 20 20 20 20  C_VALUE ){.     
2850: 20 20 20 20 20 20 20 20 20 69 66 28 20 70 52 65           if( pRe
2860: 2d 3e 61 41 72 67 5b 78 2b 6a 5d 3d 3d 63 20 29  ->aArg[x+j]==c )
2870: 7b 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  {.              
2880: 20 20 68 69 74 20 3d 20 31 3b 0a 20 20 20 20 20    hit = 1;.     
2890: 20 20 20 20 20 20 20 20 20 20 20 6a 20 3d 20 2d             j = -
28a0: 31 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  1;.             
28b0: 20 7d 0a 20 20 20 20 20 20 20 20 20 20 20 20 7d   }.            }
28c0: 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20 20  else{.          
28d0: 20 20 20 20 69 66 28 20 70 52 65 2d 3e 61 41 72      if( pRe->aAr
28e0: 67 5b 78 2b 6a 5d 3c 3d 63 20 26 26 20 70 52 65  g[x+j]<=c && pRe
28f0: 2d 3e 61 41 72 67 5b 78 2b 6a 2b 31 5d 3e 3d 63  ->aArg[x+j+1]>=c
2900: 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 20 20   ){.            
2910: 20 20 20 20 68 69 74 20 3d 20 31 3b 0a 20 20 20      hit = 1;.   
2920: 20 20 20 20 20 20 20 20 20 20 20 20 20 6a 20 3d               j =
2930: 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 20 20 20   -1;.           
2940: 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20     }else{.      
2950: 20 20 20 20 20 20 20 20 20 20 6a 2b 2b 3b 0a 20            j++;. 
2960: 20 20 20 20 20 20 20 20 20 20 20 20 20 7d 0a 20               }. 
2970: 20 20 20 20 20 20 20 20 20 20 20 7d 0a 20 20 20             }.   
2980: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
2990: 20 20 20 69 66 28 20 70 52 65 2d 3e 61 4f 70 5b     if( pRe->aOp[
29a0: 78 5d 3d 3d 52 45 5f 4f 50 5f 43 43 5f 45 58 43  x]==RE_OP_CC_EXC
29b0: 20 29 20 68 69 74 20 3d 20 21 68 69 74 3b 0a 20   ) hit = !hit;. 
29c0: 20 20 20 20 20 20 20 20 20 69 66 28 20 68 69 74           if( hit
29d0: 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28   ) re_add_state(
29e0: 70 4e 65 78 74 2c 20 78 2b 6e 29 3b 0a 20 20 20  pNext, x+n);.   
29f0: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 20 20 20         break;   
2a00: 20 20 20 20 20 20 20 20 20 0a 20 20 20 20 20 20           .      
2a10: 20 20 7d 0a 20 20 20 20 20 20 7d 0a 20 20 20 20    }.      }.    
2a20: 7d 0a 20 20 7d 0a 20 20 66 6f 72 28 69 3d 30 3b  }.  }.  for(i=0;
2a30: 20 69 3c 70 4e 65 78 74 2d 3e 6e 53 74 61 74 65   i<pNext->nState
2a40: 3b 20 69 2b 2b 29 7b 0a 20 20 20 20 69 66 28 20  ; i++){.    if( 
2a50: 70 52 65 2d 3e 61 4f 70 5b 70 4e 65 78 74 2d 3e  pRe->aOp[pNext->
2a60: 61 53 74 61 74 65 5b 69 5d 5d 3d 3d 52 45 5f 4f  aState[i]]==RE_O
2a70: 50 5f 41 43 43 45 50 54 20 29 7b 20 72 63 20 3d  P_ACCEPT ){ rc =
2a80: 20 31 3b 20 62 72 65 61 6b 3b 20 7d 0a 20 20 7d   1; break; }.  }
2a90: 0a 72 65 5f 6d 61 74 63 68 5f 65 6e 64 3a 0a 20  .re_match_end:. 
2aa0: 20 73 71 6c 69 74 65 33 5f 66 72 65 65 28 70 54   sqlite3_free(pT
2ab0: 6f 46 72 65 65 29 3b 0a 20 20 72 65 74 75 72 6e  oFree);.  return
2ac0: 20 72 63 3b 0a 7d 0a 0a 2f 2a 20 52 65 73 69 7a   rc;.}../* Resiz
2ad0: 65 20 74 68 65 20 6f 70 63 6f 64 65 20 61 6e 64  e the opcode and
2ae0: 20 61 72 67 75 6d 65 6e 74 20 61 72 72 61 79 73   argument arrays
2af0: 20 66 6f 72 20 61 6e 20 52 45 20 75 6e 64 65 72   for an RE under
2b00: 20 63 6f 6e 73 74 72 75 63 74 69 6f 6e 2e 0a 2a   construction..*
2b10: 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f  /.static int re_
2b20: 72 65 73 69 7a 65 28 52 65 43 6f 6d 70 69 6c 65  resize(ReCompile
2b30: 64 20 2a 70 2c 20 69 6e 74 20 4e 29 7b 0a 20 20  d *p, int N){.  
2b40: 63 68 61 72 20 2a 61 4f 70 3b 0a 20 20 69 6e 74  char *aOp;.  int
2b50: 20 2a 61 41 72 67 3b 0a 20 20 61 4f 70 20 3d 20   *aArg;.  aOp = 
2b60: 73 71 6c 69 74 65 33 5f 72 65 61 6c 6c 6f 63 28  sqlite3_realloc(
2b70: 70 2d 3e 61 4f 70 2c 20 4e 2a 73 69 7a 65 6f 66  p->aOp, N*sizeof
2b80: 28 70 2d 3e 61 4f 70 5b 30 5d 29 29 3b 0a 20 20  (p->aOp[0]));.  
2b90: 69 66 28 20 61 4f 70 3d 3d 30 20 29 20 72 65 74  if( aOp==0 ) ret
2ba0: 75 72 6e 20 31 3b 0a 20 20 70 2d 3e 61 4f 70 20  urn 1;.  p->aOp 
2bb0: 3d 20 61 4f 70 3b 0a 20 20 61 41 72 67 20 3d 20  = aOp;.  aArg = 
2bc0: 73 71 6c 69 74 65 33 5f 72 65 61 6c 6c 6f 63 28  sqlite3_realloc(
2bd0: 70 2d 3e 61 41 72 67 2c 20 4e 2a 73 69 7a 65 6f  p->aArg, N*sizeo
2be0: 66 28 70 2d 3e 61 41 72 67 5b 30 5d 29 29 3b 0a  f(p->aArg[0]));.
2bf0: 20 20 69 66 28 20 61 41 72 67 3d 3d 30 20 29 20    if( aArg==0 ) 
2c00: 72 65 74 75 72 6e 20 31 3b 0a 20 20 70 2d 3e 61  return 1;.  p->a
2c10: 41 72 67 20 3d 20 61 41 72 67 3b 0a 20 20 70 2d  Arg = aArg;.  p-
2c20: 3e 6e 41 6c 6c 6f 63 20 3d 20 4e 3b 0a 20 20 72  >nAlloc = N;.  r
2c30: 65 74 75 72 6e 20 30 3b 0a 7d 0a 0a 2f 2a 20 49  eturn 0;.}../* I
2c40: 6e 73 65 72 74 20 61 20 6e 65 77 20 6f 70 63 6f  nsert a new opco
2c50: 64 65 20 61 6e 64 20 61 72 67 75 6d 65 6e 74 20  de and argument 
2c60: 69 6e 74 6f 20 61 6e 20 52 45 20 75 6e 64 65 72  into an RE under
2c70: 20 63 6f 6e 73 74 72 75 63 74 69 6f 6e 2e 20 20   construction.  
2c80: 54 68 65 0a 2a 2a 20 69 6e 73 65 72 74 69 6f 6e  The.** insertion
2c90: 20 70 6f 69 6e 74 20 69 73 20 6a 75 73 74 20 70   point is just p
2ca0: 72 69 6f 72 20 74 6f 20 65 78 69 73 74 69 6e 67  rior to existing
2cb0: 20 6f 70 63 6f 64 65 20 69 42 65 66 6f 72 65 2e   opcode iBefore.
2cc0: 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72  .*/.static int r
2cd0: 65 5f 69 6e 73 65 72 74 28 52 65 43 6f 6d 70 69  e_insert(ReCompi
2ce0: 6c 65 64 20 2a 70 2c 20 69 6e 74 20 69 42 65 66  led *p, int iBef
2cf0: 6f 72 65 2c 20 69 6e 74 20 6f 70 2c 20 69 6e 74  ore, int op, int
2d00: 20 61 72 67 29 7b 0a 20 20 69 6e 74 20 69 3b 0a   arg){.  int i;.
2d10: 20 20 69 66 28 20 70 2d 3e 6e 41 6c 6c 6f 63 3c    if( p->nAlloc<
2d20: 3d 70 2d 3e 6e 53 74 61 74 65 20 26 26 20 72 65  =p->nState && re
2d30: 5f 72 65 73 69 7a 65 28 70 2c 20 70 2d 3e 6e 41  _resize(p, p->nA
2d40: 6c 6c 6f 63 2a 32 29 20 29 20 72 65 74 75 72 6e  lloc*2) ) return
2d50: 20 30 3b 0a 20 20 66 6f 72 28 69 3d 70 2d 3e 6e   0;.  for(i=p->n
2d60: 53 74 61 74 65 3b 20 69 3e 69 42 65 66 6f 72 65  State; i>iBefore
2d70: 3b 20 69 2d 2d 29 7b 0a 20 20 20 20 70 2d 3e 61  ; i--){.    p->a
2d80: 4f 70 5b 69 5d 20 3d 20 70 2d 3e 61 4f 70 5b 69  Op[i] = p->aOp[i
2d90: 2d 31 5d 3b 0a 20 20 20 20 70 2d 3e 61 41 72 67  -1];.    p->aArg
2da0: 5b 69 5d 20 3d 20 70 2d 3e 61 41 72 67 5b 69 2d  [i] = p->aArg[i-
2db0: 31 5d 3b 0a 20 20 7d 0a 20 20 70 2d 3e 6e 53 74  1];.  }.  p->nSt
2dc0: 61 74 65 2b 2b 3b 0a 20 20 70 2d 3e 61 4f 70 5b  ate++;.  p->aOp[
2dd0: 69 42 65 66 6f 72 65 5d 20 3d 20 6f 70 3b 0a 20  iBefore] = op;. 
2de0: 20 70 2d 3e 61 41 72 67 5b 69 42 65 66 6f 72 65   p->aArg[iBefore
2df0: 5d 20 3d 20 61 72 67 3b 0a 20 20 72 65 74 75 72  ] = arg;.  retur
2e00: 6e 20 69 42 65 66 6f 72 65 3b 0a 7d 0a 0a 2f 2a  n iBefore;.}../*
2e10: 20 41 70 70 65 6e 64 20 61 20 6e 65 77 20 6f 70   Append a new op
2e20: 63 6f 64 65 20 61 6e 64 20 61 72 67 75 6d 65 6e  code and argumen
2e30: 74 20 74 6f 20 74 68 65 20 65 6e 64 20 6f 66 20  t to the end of 
2e40: 74 68 65 20 52 45 20 75 6e 64 65 72 20 63 6f 6e  the RE under con
2e50: 73 74 72 75 63 74 69 6f 6e 2e 0a 2a 2f 0a 73 74  struction..*/.st
2e60: 61 74 69 63 20 69 6e 74 20 72 65 5f 61 70 70 65  atic int re_appe
2e70: 6e 64 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70  nd(ReCompiled *p
2e80: 2c 20 69 6e 74 20 6f 70 2c 20 69 6e 74 20 61 72  , int op, int ar
2e90: 67 29 7b 0a 20 20 72 65 74 75 72 6e 20 72 65 5f  g){.  return re_
2ea0: 69 6e 73 65 72 74 28 70 2c 20 70 2d 3e 6e 53 74  insert(p, p->nSt
2eb0: 61 74 65 2c 20 6f 70 2c 20 61 72 67 29 3b 0a 7d  ate, op, arg);.}
2ec0: 0a 0a 2f 2a 20 4d 61 6b 65 20 61 20 63 6f 70 79  ../* Make a copy
2ed0: 20 6f 66 20 4e 20 6f 70 63 6f 64 65 73 20 73 74   of N opcodes st
2ee0: 61 72 74 69 6e 67 20 61 74 20 69 53 74 61 72 74  arting at iStart
2ef0: 20 6f 6e 74 6f 20 74 68 65 20 65 6e 64 20 6f 66   onto the end of
2f00: 20 74 68 65 20 52 45 0a 2a 2a 20 75 6e 64 65 72   the RE.** under
2f10: 20 63 6f 6e 73 74 72 75 63 74 69 6f 6e 2e 0a 2a   construction..*
2f20: 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 72 65  /.static void re
2f30: 5f 63 6f 70 79 28 52 65 43 6f 6d 70 69 6c 65 64  _copy(ReCompiled
2f40: 20 2a 70 2c 20 69 6e 74 20 69 53 74 61 72 74 2c   *p, int iStart,
2f50: 20 69 6e 74 20 4e 29 7b 0a 20 20 69 66 28 20 70   int N){.  if( p
2f60: 2d 3e 6e 53 74 61 74 65 2b 4e 3e 3d 70 2d 3e 6e  ->nState+N>=p->n
2f70: 41 6c 6c 6f 63 20 26 26 20 72 65 5f 72 65 73 69  Alloc && re_resi
2f80: 7a 65 28 70 2c 20 70 2d 3e 6e 41 6c 6c 6f 63 2a  ze(p, p->nAlloc*
2f90: 32 2b 4e 29 20 29 20 72 65 74 75 72 6e 3b 0a 20  2+N) ) return;. 
2fa0: 20 6d 65 6d 63 70 79 28 26 70 2d 3e 61 4f 70 5b   memcpy(&p->aOp[
2fb0: 70 2d 3e 6e 53 74 61 74 65 5d 2c 20 26 70 2d 3e  p->nState], &p->
2fc0: 61 4f 70 5b 69 53 74 61 72 74 5d 2c 20 4e 2a 73  aOp[iStart], N*s
2fd0: 69 7a 65 6f 66 28 70 2d 3e 61 4f 70 5b 30 5d 29  izeof(p->aOp[0])
2fe0: 29 3b 0a 20 20 6d 65 6d 63 70 79 28 26 70 2d 3e  );.  memcpy(&p->
2ff0: 61 41 72 67 5b 70 2d 3e 6e 53 74 61 74 65 5d 2c  aArg[p->nState],
3000: 20 26 70 2d 3e 61 41 72 67 5b 69 53 74 61 72 74   &p->aArg[iStart
3010: 5d 2c 20 4e 2a 73 69 7a 65 6f 66 28 70 2d 3e 61  ], N*sizeof(p->a
3020: 41 72 67 5b 30 5d 29 29 3b 0a 20 20 70 2d 3e 6e  Arg[0]));.  p->n
3030: 53 74 61 74 65 20 2b 3d 20 4e 3b 0a 7d 0a 0a 2f  State += N;.}../
3040: 2a 20 52 65 74 75 72 6e 20 74 72 75 65 20 69 66  * Return true if
3050: 20 63 20 69 73 20 61 20 68 65 78 61 64 65 63 69   c is a hexadeci
3060: 6d 61 6c 20 64 69 67 69 74 20 63 68 61 72 61 63  mal digit charac
3070: 74 65 72 3a 20 20 5b 30 2d 39 61 2d 66 41 2d 46  ter:  [0-9a-fA-F
3080: 5d 0a 2a 2a 20 49 66 20 63 20 69 73 20 61 20 68  ].** If c is a h
3090: 65 78 20 64 69 67 69 74 2c 20 61 6c 73 6f 20 73  ex digit, also s
30a0: 65 74 20 2a 70 56 20 3d 20 28 2a 70 56 29 2a 31  et *pV = (*pV)*1
30b0: 36 20 2b 20 76 61 6c 75 65 6f 66 28 63 29 2e 20  6 + valueof(c). 
30c0: 20 49 66 0a 2a 2a 20 63 20 69 73 20 6e 6f 74 20   If.** c is not 
30d0: 61 20 68 65 78 20 64 69 67 69 74 20 2a 70 56 20  a hex digit *pV 
30e0: 69 73 20 75 6e 63 68 61 6e 67 65 64 2e 0a 2a 2f  is unchanged..*/
30f0: 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 68  .static int re_h
3100: 65 78 28 69 6e 74 20 63 2c 20 69 6e 74 20 2a 70  ex(int c, int *p
3110: 56 29 7b 0a 20 20 69 66 28 20 63 3e 3d 27 30 27  V){.  if( c>='0'
3120: 20 26 26 20 63 3c 3d 27 39 27 20 29 7b 0a 20 20   && c<='9' ){.  
3130: 20 20 63 20 2d 3d 20 27 30 27 3b 0a 20 20 7d 65    c -= '0';.  }e
3140: 6c 73 65 20 69 66 28 20 63 3e 3d 27 61 27 20 26  lse if( c>='a' &
3150: 26 20 63 3c 3d 27 66 27 20 29 7b 0a 20 20 20 20  & c<='f' ){.    
3160: 63 20 2d 3d 20 27 61 27 20 2d 20 31 30 3b 0a 20  c -= 'a' - 10;. 
3170: 20 7d 65 6c 73 65 20 69 66 28 20 63 3e 3d 27 41   }else if( c>='A
3180: 27 20 26 26 20 63 3c 3d 27 46 27 20 29 7b 0a 20  ' && c<='F' ){. 
3190: 20 20 20 63 20 2d 3d 20 27 41 27 20 2d 20 31 30     c -= 'A' - 10
31a0: 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 72  ;.  }else{.    r
31b0: 65 74 75 72 6e 20 30 3b 0a 20 20 7d 0a 20 20 2a  eturn 0;.  }.  *
31c0: 70 56 20 3d 20 28 2a 70 56 29 2a 31 36 20 2b 20  pV = (*pV)*16 + 
31d0: 28 63 20 26 20 30 78 66 66 29 3b 0a 20 20 72 65  (c & 0xff);.  re
31e0: 74 75 72 6e 20 31 3b 0a 7d 0a 0a 2f 2a 20 41 20  turn 1;.}../* A 
31f0: 62 61 63 6b 73 6c 61 73 68 20 63 68 61 72 61 63  backslash charac
3200: 74 65 72 20 68 61 73 20 62 65 65 6e 20 73 65 65  ter has been see
3210: 6e 2c 20 72 65 61 64 20 74 68 65 20 6e 65 78 74  n, read the next
3220: 20 63 68 61 72 61 63 74 65 72 20 61 6e 64 0a 2a   character and.*
3230: 2a 20 72 65 74 75 72 6e 20 69 74 73 20 69 6e 74  * return its int
3240: 65 72 70 72 65 74 61 74 69 6f 6e 2e 0a 2a 2f 0a  erpretation..*/.
3250: 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20  static unsigned 
3260: 72 65 5f 65 73 63 5f 63 68 61 72 28 52 65 43 6f  re_esc_char(ReCo
3270: 6d 70 69 6c 65 64 20 2a 70 29 7b 0a 20 20 73 74  mpiled *p){.  st
3280: 61 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20  atic const char 
3290: 7a 45 73 63 5b 5d 20 3d 20 22 61 66 6e 72 74 76  zEsc[] = "afnrtv
32a0: 5c 5c 28 29 2a 2e 2b 3f 5b 24 5e 7b 7c 7d 5d 22  \\()*.+?[$^{|}]"
32b0: 3b 0a 20 20 73 74 61 74 69 63 20 63 6f 6e 73 74  ;.  static const
32c0: 20 63 68 61 72 20 7a 54 72 61 6e 73 5b 5d 20 3d   char zTrans[] =
32d0: 20 22 5c 61 5c 66 5c 6e 5c 72 5c 74 5c 76 22 3b   "\a\f\n\r\t\v";
32e0: 0a 20 20 69 6e 74 20 69 2c 20 76 20 3d 20 30 3b  .  int i, v = 0;
32f0: 0a 20 20 63 68 61 72 20 63 3b 0a 20 20 69 66 28  .  char c;.  if(
3300: 20 70 2d 3e 73 49 6e 2e 69 3e 3d 70 2d 3e 73 49   p->sIn.i>=p->sI
3310: 6e 2e 6d 78 20 29 20 72 65 74 75 72 6e 20 30 3b  n.mx ) return 0;
3320: 0a 20 20 63 20 3d 20 70 2d 3e 73 49 6e 2e 7a 5b  .  c = p->sIn.z[
3330: 70 2d 3e 73 49 6e 2e 69 5d 3b 0a 20 20 69 66 28  p->sIn.i];.  if(
3340: 20 63 3d 3d 27 75 27 20 26 26 20 70 2d 3e 73 49   c=='u' && p->sI
3350: 6e 2e 69 2b 34 3c 70 2d 3e 73 49 6e 2e 6d 78 20  n.i+4<p->sIn.mx 
3360: 29 7b 0a 20 20 20 20 63 6f 6e 73 74 20 75 6e 73  ){.    const uns
3370: 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 49 6e 20  igned char *zIn 
3380: 3d 20 70 2d 3e 73 49 6e 2e 7a 20 2b 20 70 2d 3e  = p->sIn.z + p->
3390: 73 49 6e 2e 69 3b 0a 20 20 20 20 69 66 28 20 72  sIn.i;.    if( r
33a0: 65 5f 68 65 78 28 7a 49 6e 5b 31 5d 2c 26 76 29  e_hex(zIn[1],&v)
33b0: 0a 20 20 20 20 20 26 26 20 72 65 5f 68 65 78 28  .     && re_hex(
33c0: 7a 49 6e 5b 32 5d 2c 26 76 29 0a 20 20 20 20 20  zIn[2],&v).     
33d0: 26 26 20 72 65 5f 68 65 78 28 7a 49 6e 5b 33 5d  && re_hex(zIn[3]
33e0: 2c 26 76 29 0a 20 20 20 20 20 26 26 20 72 65 5f  ,&v).     && re_
33f0: 68 65 78 28 7a 49 6e 5b 34 5d 2c 26 76 29 0a 20  hex(zIn[4],&v). 
3400: 20 20 20 29 7b 0a 20 20 20 20 20 20 70 2d 3e 73     ){.      p->s
3410: 49 6e 2e 69 20 2b 3d 20 35 3b 0a 20 20 20 20 20  In.i += 5;.     
3420: 20 72 65 74 75 72 6e 20 76 3b 0a 20 20 20 20 7d   return v;.    }
3430: 0a 20 20 7d 0a 20 20 69 66 28 20 63 3d 3d 27 78  .  }.  if( c=='x
3440: 27 20 26 26 20 70 2d 3e 73 49 6e 2e 69 2b 32 3c  ' && p->sIn.i+2<
3450: 70 2d 3e 73 49 6e 2e 6d 78 20 29 7b 0a 20 20 20  p->sIn.mx ){.   
3460: 20 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20   const unsigned 
3470: 63 68 61 72 20 2a 7a 49 6e 20 3d 20 70 2d 3e 73  char *zIn = p->s
3480: 49 6e 2e 7a 20 2b 20 70 2d 3e 73 49 6e 2e 69 3b  In.z + p->sIn.i;
3490: 0a 20 20 20 20 69 66 28 20 72 65 5f 68 65 78 28  .    if( re_hex(
34a0: 7a 49 6e 5b 31 5d 2c 26 76 29 0a 20 20 20 20 20  zIn[1],&v).     
34b0: 26 26 20 72 65 5f 68 65 78 28 7a 49 6e 5b 32 5d  && re_hex(zIn[2]
34c0: 2c 26 76 29 0a 20 20 20 20 29 7b 0a 20 20 20 20  ,&v).    ){.    
34d0: 20 20 70 2d 3e 73 49 6e 2e 69 20 2b 3d 20 33 3b    p->sIn.i += 3;
34e0: 0a 20 20 20 20 20 20 72 65 74 75 72 6e 20 76 3b  .      return v;
34f0: 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20 66 6f 72  .    }.  }.  for
3500: 28 69 3d 30 3b 20 7a 45 73 63 5b 69 5d 20 26 26  (i=0; zEsc[i] &&
3510: 20 7a 45 73 63 5b 69 5d 21 3d 63 3b 20 69 2b 2b   zEsc[i]!=c; i++
3520: 29 7b 7d 0a 20 20 69 66 28 20 7a 45 73 63 5b 69  ){}.  if( zEsc[i
3530: 5d 20 29 7b 0a 20 20 20 20 69 66 28 20 69 3c 36  ] ){.    if( i<6
3540: 20 29 20 63 20 3d 20 7a 54 72 61 6e 73 5b 69 5d   ) c = zTrans[i]
3550: 3b 0a 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b  ;.    p->sIn.i++
3560: 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 70  ;.  }else{.    p
3570: 2d 3e 7a 45 72 72 20 3d 20 22 75 6e 6b 6e 6f 77  ->zErr = "unknow
3580: 6e 20 5c 5c 20 65 73 63 61 70 65 22 3b 0a 20 20  n \\ escape";.  
3590: 7d 0a 20 20 72 65 74 75 72 6e 20 63 3b 0a 7d 0a  }.  return c;.}.
35a0: 0a 2f 2a 20 46 6f 72 77 61 72 64 20 64 65 63 6c  ./* Forward decl
35b0: 61 72 61 74 69 6f 6e 20 2a 2f 0a 73 74 61 74 69  aration */.stati
35c0: 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 72 65  c const char *re
35d0: 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 73 74 72 69  _subcompile_stri
35e0: 6e 67 28 52 65 43 6f 6d 70 69 6c 65 64 2a 29 3b  ng(ReCompiled*);
35f0: 0a 0a 2f 2a 20 50 65 65 6b 20 61 74 20 74 68 65  ../* Peek at the
3600: 20 6e 65 78 74 20 62 79 74 65 20 6f 66 20 69 6e   next byte of in
3610: 70 75 74 20 2a 2f 0a 73 74 61 74 69 63 20 75 6e  put */.static un
3620: 73 69 67 6e 65 64 20 63 68 61 72 20 72 65 50 65  signed char rePe
3630: 65 6b 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70  ek(ReCompiled *p
3640: 29 7b 0a 20 20 72 65 74 75 72 6e 20 70 2d 3e 73  ){.  return p->s
3650: 49 6e 2e 69 3c 70 2d 3e 73 49 6e 2e 6d 78 20 3f  In.i<p->sIn.mx ?
3660: 20 70 2d 3e 73 49 6e 2e 7a 5b 70 2d 3e 73 49 6e   p->sIn.z[p->sIn
3670: 2e 69 5d 20 3a 20 30 3b 0a 7d 0a 0a 2f 2a 20 43  .i] : 0;.}../* C
3680: 6f 6d 70 69 6c 65 20 52 45 20 74 65 78 74 20 69  ompile RE text i
3690: 6e 74 6f 20 61 20 73 65 71 75 65 6e 63 65 20 6f  nto a sequence o
36a0: 66 20 6f 70 63 6f 64 65 73 2e 20 20 43 6f 6e 74  f opcodes.  Cont
36b0: 69 6e 75 65 20 75 70 20 74 6f 20 74 68 65 0a 2a  inue up to the.*
36c0: 2a 20 66 69 72 73 74 20 75 6e 6d 61 74 63 68 65  * first unmatche
36d0: 64 20 22 29 22 20 63 68 61 72 61 63 74 65 72 2c  d ")" character,
36e0: 20 74 68 65 6e 20 72 65 74 75 72 6e 2e 20 20 49   then return.  I
36f0: 66 20 61 6e 20 65 72 72 6f 72 20 69 73 20 66 6f  f an error is fo
3700: 75 6e 64 2c 0a 2a 2a 20 72 65 74 75 72 6e 20 61  und,.** return a
3710: 20 70 6f 69 6e 74 65 72 20 74 6f 20 74 68 65 20   pointer to the 
3720: 65 72 72 6f 72 20 6d 65 73 73 61 67 65 20 73 74  error message st
3730: 72 69 6e 67 2e 0a 2a 2f 0a 73 74 61 74 69 63 20  ring..*/.static 
3740: 63 6f 6e 73 74 20 63 68 61 72 20 2a 72 65 5f 73  const char *re_s
3750: 75 62 63 6f 6d 70 69 6c 65 5f 72 65 28 52 65 43  ubcompile_re(ReC
3760: 6f 6d 70 69 6c 65 64 20 2a 70 29 7b 0a 20 20 63  ompiled *p){.  c
3770: 6f 6e 73 74 20 63 68 61 72 20 2a 7a 45 72 72 3b  onst char *zErr;
3780: 0a 20 20 69 6e 74 20 69 53 74 61 72 74 2c 20 69  .  int iStart, i
3790: 45 6e 64 2c 20 69 47 6f 74 6f 3b 0a 20 20 69 53  End, iGoto;.  iS
37a0: 74 61 72 74 20 3d 20 70 2d 3e 6e 53 74 61 74 65  tart = p->nState
37b0: 3b 0a 20 20 7a 45 72 72 20 3d 20 72 65 5f 73 75  ;.  zErr = re_su
37c0: 62 63 6f 6d 70 69 6c 65 5f 73 74 72 69 6e 67 28  bcompile_string(
37d0: 70 29 3b 0a 20 20 69 66 28 20 7a 45 72 72 20 29  p);.  if( zErr )
37e0: 20 72 65 74 75 72 6e 20 7a 45 72 72 3b 0a 20 20   return zErr;.  
37f0: 77 68 69 6c 65 28 20 72 65 50 65 65 6b 28 70 29  while( rePeek(p)
3800: 3d 3d 27 7c 27 20 29 7b 0a 20 20 20 20 69 45 6e  =='|' ){.    iEn
3810: 64 20 3d 20 70 2d 3e 6e 53 74 61 74 65 3b 0a 20  d = p->nState;. 
3820: 20 20 20 72 65 5f 69 6e 73 65 72 74 28 70 2c 20     re_insert(p, 
3830: 69 53 74 61 72 74 2c 20 52 45 5f 4f 50 5f 46 4f  iStart, RE_OP_FO
3840: 52 4b 2c 20 69 45 6e 64 20 2b 20 32 20 2d 20 69  RK, iEnd + 2 - i
3850: 53 74 61 72 74 29 3b 0a 20 20 20 20 69 47 6f 74  Start);.    iGot
3860: 6f 20 3d 20 72 65 5f 61 70 70 65 6e 64 28 70 2c  o = re_append(p,
3870: 20 52 45 5f 4f 50 5f 47 4f 54 4f 2c 20 30 29 3b   RE_OP_GOTO, 0);
3880: 0a 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b  .    p->sIn.i++;
3890: 0a 20 20 20 20 7a 45 72 72 20 3d 20 72 65 5f 73  .    zErr = re_s
38a0: 75 62 63 6f 6d 70 69 6c 65 5f 73 74 72 69 6e 67  ubcompile_string
38b0: 28 70 29 3b 0a 20 20 20 20 69 66 28 20 7a 45 72  (p);.    if( zEr
38c0: 72 20 29 20 72 65 74 75 72 6e 20 7a 45 72 72 3b  r ) return zErr;
38d0: 0a 20 20 20 20 70 2d 3e 61 41 72 67 5b 69 47 6f  .    p->aArg[iGo
38e0: 74 6f 5d 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20  to] = p->nState 
38f0: 2d 20 69 47 6f 74 6f 3b 0a 20 20 7d 0a 20 20 72  - iGoto;.  }.  r
3900: 65 74 75 72 6e 20 30 3b 0a 7d 0a 0a 2f 2a 20 43  eturn 0;.}../* C
3910: 6f 6d 70 69 6c 65 20 61 6e 20 65 6c 65 6d 65 6e  ompile an elemen
3920: 74 20 6f 66 20 72 65 67 75 6c 61 72 20 65 78 70  t of regular exp
3930: 72 65 73 73 69 6f 6e 20 74 65 78 74 20 28 61 6e  ression text (an
3940: 79 74 68 69 6e 67 20 74 68 61 74 20 63 61 6e 20  ything that can 
3950: 62 65 0a 2a 2a 20 61 6e 20 6f 70 65 72 61 6e 64  be.** an operand
3960: 20 74 6f 20 74 68 65 20 22 7c 22 20 6f 70 65 72   to the "|" oper
3970: 61 74 6f 72 29 2e 20 20 52 65 74 75 72 6e 20 4e  ator).  Return N
3980: 55 4c 4c 20 6f 6e 20 73 75 63 63 65 73 73 20 6f  ULL on success o
3990: 72 20 61 20 70 6f 69 6e 74 65 72 0a 2a 2a 20 74  r a pointer.** t
39a0: 6f 20 74 68 65 20 65 72 72 6f 72 20 6d 65 73 73  o the error mess
39b0: 61 67 65 20 69 66 20 74 68 65 72 65 20 69 73 20  age if there is 
39c0: 61 20 70 72 6f 62 6c 65 6d 2e 0a 2a 2f 0a 73 74  a problem..*/.st
39d0: 61 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20  atic const char 
39e0: 2a 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 73  *re_subcompile_s
39f0: 74 72 69 6e 67 28 52 65 43 6f 6d 70 69 6c 65 64  tring(ReCompiled
3a00: 20 2a 70 29 7b 0a 20 20 69 6e 74 20 69 50 72 65   *p){.  int iPre
3a10: 76 20 3d 20 2d 31 3b 0a 20 20 69 6e 74 20 69 53  v = -1;.  int iS
3a20: 74 61 72 74 3b 0a 20 20 75 6e 73 69 67 6e 65 64  tart;.  unsigned
3a30: 20 63 3b 0a 20 20 63 6f 6e 73 74 20 63 68 61 72   c;.  const char
3a40: 20 2a 7a 45 72 72 3b 0a 20 20 77 68 69 6c 65 28   *zErr;.  while(
3a50: 20 28 63 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68   (c = p->xNextCh
3a60: 61 72 28 26 70 2d 3e 73 49 6e 29 29 21 3d 30 20  ar(&p->sIn))!=0 
3a70: 29 7b 0a 20 20 20 20 69 53 74 61 72 74 20 3d 20  ){.    iStart = 
3a80: 70 2d 3e 6e 53 74 61 74 65 3b 0a 20 20 20 20 73  p->nState;.    s
3a90: 77 69 74 63 68 28 20 63 20 29 7b 0a 20 20 20 20  witch( c ){.    
3aa0: 20 20 63 61 73 65 20 27 7c 27 3a 0a 20 20 20 20    case '|':.    
3ab0: 20 20 63 61 73 65 20 27 24 27 3a 20 0a 20 20 20    case '$': .   
3ac0: 20 20 20 63 61 73 65 20 27 29 27 3a 20 7b 0a 20     case ')': {. 
3ad0: 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2d         p->sIn.i-
3ae0: 2d 3b 0a 20 20 20 20 20 20 20 20 72 65 74 75 72  -;.        retur
3af0: 6e 20 30 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20  n 0;.      }.   
3b00: 20 20 20 63 61 73 65 20 27 28 27 3a 20 7b 0a 20     case '(': {. 
3b10: 20 20 20 20 20 20 20 7a 45 72 72 20 3d 20 72 65         zErr = re
3b20: 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 72 65 28 70  _subcompile_re(p
3b30: 29 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 7a  );.        if( z
3b40: 45 72 72 20 29 20 72 65 74 75 72 6e 20 7a 45 72  Err ) return zEr
3b50: 72 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 72  r;.        if( r
3b60: 65 50 65 65 6b 28 70 29 21 3d 27 29 27 20 29 20  ePeek(p)!=')' ) 
3b70: 72 65 74 75 72 6e 20 22 75 6e 6d 61 74 63 68 65  return "unmatche
3b80: 64 20 27 28 27 22 3b 0a 20 20 20 20 20 20 20 20  d '('";.        
3b90: 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20  p->sIn.i++;.    
3ba0: 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20      break;.     
3bb0: 20 7d 0a 20 20 20 20 20 20 63 61 73 65 20 27 2e   }.      case '.
3bc0: 27 3a 20 7b 0a 20 20 20 20 20 20 20 20 69 66 28  ': {.        if(
3bd0: 20 72 65 50 65 65 6b 28 70 29 3d 3d 27 2a 27 20   rePeek(p)=='*' 
3be0: 29 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f  ){.          re_
3bf0: 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f  append(p, RE_OP_
3c00: 41 4e 59 53 54 41 52 2c 20 30 29 3b 0a 20 20 20  ANYSTAR, 0);.   
3c10: 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b         p->sIn.i+
3c20: 2b 3b 0a 20 20 20 20 20 20 20 20 7d 65 6c 73 65  +;.        }else
3c30: 7b 20 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f  { .          re_
3c40: 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f  append(p, RE_OP_
3c50: 41 4e 59 2c 20 30 29 3b 0a 20 20 20 20 20 20 20  ANY, 0);.       
3c60: 20 7d 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b   }.        break
3c70: 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20  ;.      }.      
3c80: 63 61 73 65 20 27 2a 27 3a 20 7b 0a 20 20 20 20  case '*': {.    
3c90: 20 20 20 20 69 66 28 20 69 50 72 65 76 3c 30 20      if( iPrev<0 
3ca0: 29 20 72 65 74 75 72 6e 20 22 27 2a 27 20 77 69  ) return "'*' wi
3cb0: 74 68 6f 75 74 20 6f 70 65 72 61 6e 64 22 3b 0a  thout operand";.
3cc0: 20 20 20 20 20 20 20 20 72 65 5f 69 6e 73 65 72          re_inser
3cd0: 74 28 70 2c 20 69 50 72 65 76 2c 20 52 45 5f 4f  t(p, iPrev, RE_O
3ce0: 50 5f 47 4f 54 4f 2c 20 70 2d 3e 6e 53 74 61 74  P_GOTO, p->nStat
3cf0: 65 20 2d 20 69 50 72 65 76 20 2b 20 31 29 3b 0a  e - iPrev + 1);.
3d00: 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e          re_appen
3d10: 64 28 70 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c  d(p, RE_OP_FORK,
3d20: 20 69 50 72 65 76 20 2d 20 70 2d 3e 6e 53 74 61   iPrev - p->nSta
3d30: 74 65 20 2b 20 31 29 3b 0a 20 20 20 20 20 20 20  te + 1);.       
3d40: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a   break;.      }.
3d50: 20 20 20 20 20 20 63 61 73 65 20 27 2b 27 3a 20        case '+': 
3d60: 7b 0a 20 20 20 20 20 20 20 20 69 66 28 20 69 50  {.        if( iP
3d70: 72 65 76 3c 30 20 29 20 72 65 74 75 72 6e 20 22  rev<0 ) return "
3d80: 27 2b 27 20 77 69 74 68 6f 75 74 20 6f 70 65 72  '+' without oper
3d90: 61 6e 64 22 3b 0a 20 20 20 20 20 20 20 20 72 65  and";.        re
3da0: 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50  _append(p, RE_OP
3db0: 5f 46 4f 52 4b 2c 20 69 50 72 65 76 20 2d 20 70  _FORK, iPrev - p
3dc0: 2d 3e 6e 53 74 61 74 65 29 3b 0a 20 20 20 20 20  ->nState);.     
3dd0: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20     break;.      
3de0: 7d 0a 20 20 20 20 20 20 63 61 73 65 20 27 3f 27  }.      case '?'
3df0: 3a 20 7b 0a 20 20 20 20 20 20 20 20 69 66 28 20  : {.        if( 
3e00: 69 50 72 65 76 3c 30 20 29 20 72 65 74 75 72 6e  iPrev<0 ) return
3e10: 20 22 27 3f 27 20 77 69 74 68 6f 75 74 20 6f 70   "'?' without op
3e20: 65 72 61 6e 64 22 3b 0a 20 20 20 20 20 20 20 20  erand";.        
3e30: 72 65 5f 69 6e 73 65 72 74 28 70 2c 20 69 50 72  re_insert(p, iPr
3e40: 65 76 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20  ev, RE_OP_FORK, 
3e50: 70 2d 3e 6e 53 74 61 74 65 20 2d 20 69 50 72 65  p->nState - iPre
3e60: 76 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 62 72  v+1);.        br
3e70: 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20  eak;.      }.   
3e80: 20 20 20 63 61 73 65 20 27 7b 27 3a 20 7b 0a 20     case '{': {. 
3e90: 20 20 20 20 20 20 20 69 6e 74 20 6d 20 3d 20 30         int m = 0
3ea0: 2c 20 6e 20 3d 20 30 3b 0a 20 20 20 20 20 20 20  , n = 0;.       
3eb0: 20 69 6e 74 20 73 7a 2c 20 6a 3b 0a 20 20 20 20   int sz, j;.    
3ec0: 20 20 20 20 69 66 28 20 69 50 72 65 76 3c 30 20      if( iPrev<0 
3ed0: 29 20 72 65 74 75 72 6e 20 22 27 7b 6d 2c 6e 7d  ) return "'{m,n}
3ee0: 27 20 77 69 74 68 6f 75 74 20 6f 70 65 72 61 6e  ' without operan
3ef0: 64 22 3b 0a 20 20 20 20 20 20 20 20 77 68 69 6c  d";.        whil
3f00: 65 28 20 28 63 3d 72 65 50 65 65 6b 28 70 29 29  e( (c=rePeek(p))
3f10: 3e 3d 27 30 27 20 26 26 20 63 3c 3d 27 39 27 20  >='0' && c<='9' 
3f20: 29 7b 20 6d 20 3d 20 6d 2a 31 30 20 2b 20 63 20  ){ m = m*10 + c 
3f30: 2d 20 27 30 27 3b 20 70 2d 3e 73 49 6e 2e 69 2b  - '0'; p->sIn.i+
3f40: 2b 3b 20 7d 0a 20 20 20 20 20 20 20 20 6e 20 3d  +; }.        n =
3f50: 20 6d 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20   m;.        if( 
3f60: 63 3d 3d 27 2c 27 20 29 7b 0a 20 20 20 20 20 20  c==',' ){.      
3f70: 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a      p->sIn.i++;.
3f80: 20 20 20 20 20 20 20 20 20 20 6e 20 3d 20 30 3b            n = 0;
3f90: 0a 20 20 20 20 20 20 20 20 20 20 77 68 69 6c 65  .          while
3fa0: 28 20 28 63 3d 72 65 50 65 65 6b 28 70 29 29 3e  ( (c=rePeek(p))>
3fb0: 3d 27 30 27 20 26 26 20 63 3c 3d 27 39 27 20 29  ='0' && c<='9' )
3fc0: 7b 20 6e 20 3d 20 6e 2a 31 30 20 2b 20 63 2d 27  { n = n*10 + c-'
3fd0: 30 27 3b 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 20  0'; p->sIn.i++; 
3fe0: 7d 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  }.        }.    
3ff0: 20 20 20 20 69 66 28 20 63 21 3d 27 7d 27 20 29      if( c!='}' )
4000: 20 72 65 74 75 72 6e 20 22 75 6e 6d 61 74 63 68   return "unmatch
4010: 65 64 20 27 7b 27 22 3b 0a 20 20 20 20 20 20 20  ed '{'";.       
4020: 20 69 66 28 20 6e 3e 30 20 26 26 20 6e 3c 6d 20   if( n>0 && n<m 
4030: 29 20 72 65 74 75 72 6e 20 22 6e 20 6c 65 73 73  ) return "n less
4040: 20 74 68 61 6e 20 6d 20 69 6e 20 27 7b 6d 2c 6e   than m in '{m,n
4050: 7d 27 22 3b 0a 20 20 20 20 20 20 20 20 70 2d 3e  }'";.        p->
4060: 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20 20 20  sIn.i++;.       
4070: 20 73 7a 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20   sz = p->nState 
4080: 2d 20 69 50 72 65 76 3b 0a 20 20 20 20 20 20 20  - iPrev;.       
4090: 20 69 66 28 20 6d 3d 3d 30 20 29 7b 0a 20 20 20   if( m==0 ){.   
40a0: 20 20 20 20 20 20 20 69 66 28 20 6e 3d 3d 30 20         if( n==0 
40b0: 29 20 72 65 74 75 72 6e 20 22 62 6f 74 68 20 6d  ) return "both m
40c0: 20 61 6e 64 20 6e 20 61 72 65 20 7a 65 72 6f 20   and n are zero 
40d0: 69 6e 20 27 7b 6d 2c 6e 7d 27 22 3b 0a 20 20 20  in '{m,n}'";.   
40e0: 20 20 20 20 20 20 20 72 65 5f 69 6e 73 65 72 74         re_insert
40f0: 28 70 2c 20 69 50 72 65 76 2c 20 52 45 5f 4f 50  (p, iPrev, RE_OP
4100: 5f 46 4f 52 4b 2c 20 73 7a 2b 31 29 3b 0a 20 20  _FORK, sz+1);.  
4110: 20 20 20 20 20 20 20 20 6e 2d 2d 3b 0a 20 20 20          n--;.   
4120: 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20       }else{.    
4130: 20 20 20 20 20 20 66 6f 72 28 6a 3d 31 3b 20 6a        for(j=1; j
4140: 3c 6d 3b 20 6a 2b 2b 29 20 72 65 5f 63 6f 70 79  <m; j++) re_copy
4150: 28 70 2c 20 69 50 72 65 76 2c 20 73 7a 29 3b 0a  (p, iPrev, sz);.
4160: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
4170: 20 20 66 6f 72 28 6a 3d 6d 3b 20 6a 3c 6e 3b 20    for(j=m; j<n; 
4180: 6a 2b 2b 29 7b 0a 20 20 20 20 20 20 20 20 20 20  j++){.          
4190: 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f  re_append(p, RE_
41a0: 4f 50 5f 46 4f 52 4b 2c 20 73 7a 2b 31 29 3b 0a  OP_FORK, sz+1);.
41b0: 20 20 20 20 20 20 20 20 20 20 72 65 5f 63 6f 70            re_cop
41c0: 79 28 70 2c 20 69 50 72 65 76 2c 20 73 7a 29 3b  y(p, iPrev, sz);
41d0: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20  .        }.     
41e0: 20 20 20 69 66 28 20 6e 3d 3d 30 20 26 26 20 6d     if( n==0 && m
41f0: 3e 30 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20  >0 ){.          
4200: 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f  re_append(p, RE_
4210: 4f 50 5f 46 4f 52 4b 2c 20 2d 73 7a 29 3b 0a 20  OP_FORK, -sz);. 
4220: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
4230: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a   break;.      }.
4240: 20 20 20 20 20 20 63 61 73 65 20 27 5b 27 3a 20        case '[': 
4250: 7b 0a 20 20 20 20 20 20 20 20 69 6e 74 20 69 46  {.        int iF
4260: 69 72 73 74 20 3d 20 70 2d 3e 6e 53 74 61 74 65  irst = p->nState
4270: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 72 65  ;.        if( re
4280: 50 65 65 6b 28 70 29 3d 3d 27 5e 27 20 29 7b 0a  Peek(p)=='^' ){.
4290: 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 70 70            re_app
42a0: 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f  end(p, RE_OP_CC_
42b0: 45 58 43 2c 20 30 29 3b 0a 20 20 20 20 20 20 20  EXC, 0);.       
42c0: 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20     p->sIn.i++;. 
42d0: 20 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20         }else{.  
42e0: 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e          re_appen
42f0: 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f 49 4e  d(p, RE_OP_CC_IN
4300: 43 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20 7d  C, 0);.        }
4310: 0a 20 20 20 20 20 20 20 20 77 68 69 6c 65 28 20  .        while( 
4320: 28 63 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61  (c = p->xNextCha
4330: 72 28 26 70 2d 3e 73 49 6e 29 29 21 3d 30 20 29  r(&p->sIn))!=0 )
4340: 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20  {.          if( 
4350: 63 3d 3d 27 5b 27 20 26 26 20 72 65 50 65 65 6b  c=='[' && rePeek
4360: 28 70 29 3d 3d 27 3a 27 20 29 7b 0a 20 20 20 20  (p)==':' ){.    
4370: 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20 22          return "
4380: 50 4f 53 49 58 20 63 68 61 72 61 63 74 65 72 20  POSIX character 
4390: 63 6c 61 73 73 65 73 20 6e 6f 74 20 73 75 70 70  classes not supp
43a0: 6f 72 74 65 64 22 3b 0a 20 20 20 20 20 20 20 20  orted";.        
43b0: 20 20 7d 0a 20 20 20 20 20 20 20 20 20 20 69 66    }.          if
43c0: 28 20 63 3d 3d 27 5c 5c 27 20 29 20 63 20 3d 20  ( c=='\\' ) c = 
43d0: 72 65 5f 65 73 63 5f 63 68 61 72 28 70 29 3b 0a  re_esc_char(p);.
43e0: 20 20 20 20 20 20 20 20 20 20 69 66 28 20 72 65            if( re
43f0: 50 65 65 6b 28 70 29 3d 3d 27 2d 27 20 29 7b 0a  Peek(p)=='-' ){.
4400: 20 20 20 20 20 20 20 20 20 20 20 20 72 65 5f 61              re_a
4410: 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 43  ppend(p, RE_OP_C
4420: 43 5f 52 41 4e 47 45 2c 20 63 29 3b 0a 20 20 20  C_RANGE, c);.   
4430: 20 20 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e           p->sIn.
4440: 69 2b 2b 3b 0a 20 20 20 20 20 20 20 20 20 20 20  i++;.           
4450: 20 63 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61   c = p->xNextCha
4460: 72 28 26 70 2d 3e 73 49 6e 29 3b 0a 20 20 20 20  r(&p->sIn);.    
4470: 20 20 20 20 20 20 20 20 69 66 28 20 63 3d 3d 27          if( c=='
4480: 5c 5c 27 20 29 20 63 20 3d 20 72 65 5f 65 73 63  \\' ) c = re_esc
4490: 5f 63 68 61 72 28 70 29 3b 0a 20 20 20 20 20 20  _char(p);.      
44a0: 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28        re_append(
44b0: 70 2c 20 52 45 5f 4f 50 5f 43 43 5f 52 41 4e 47  p, RE_OP_CC_RANG
44c0: 45 2c 20 63 29 3b 0a 20 20 20 20 20 20 20 20 20  E, c);.         
44d0: 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20   }else{.        
44e0: 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c      re_append(p,
44f0: 20 52 45 5f 4f 50 5f 43 43 5f 56 41 4c 55 45 2c   RE_OP_CC_VALUE,
4500: 20 63 29 3b 0a 20 20 20 20 20 20 20 20 20 20 7d   c);.          }
4510: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 72  .          if( r
4520: 65 50 65 65 6b 28 70 29 3d 3d 27 5d 27 20 29 7b  ePeek(p)==']' ){
4530: 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 20 62 72 65   p->sIn.i++; bre
4540: 61 6b 3b 20 7d 0a 20 20 20 20 20 20 20 20 7d 0a  ak; }.        }.
4550: 20 20 20 20 20 20 20 20 69 66 28 20 63 3d 3d 30          if( c==0
4560: 20 29 20 72 65 74 75 72 6e 20 22 75 6e 63 6c 6f   ) return "unclo
4570: 73 65 64 20 27 5b 27 22 3b 0a 20 20 20 20 20 20  sed '['";.      
4580: 20 20 70 2d 3e 61 41 72 67 5b 69 46 69 72 73 74    p->aArg[iFirst
4590: 5d 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20 2d 20  ] = p->nState - 
45a0: 69 46 69 72 73 74 3b 0a 20 20 20 20 20 20 20 20  iFirst;.        
45b0: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20  break;.      }. 
45c0: 20 20 20 20 20 63 61 73 65 20 27 5c 5c 27 3a 20       case '\\': 
45d0: 7b 0a 20 20 20 20 20 20 20 20 69 6e 74 20 73 70  {.        int sp
45e0: 65 63 69 61 6c 4f 70 20 3d 20 30 3b 0a 20 20 20  ecialOp = 0;.   
45f0: 20 20 20 20 20 73 77 69 74 63 68 28 20 72 65 50       switch( reP
4600: 65 65 6b 28 70 29 20 29 7b 0a 20 20 20 20 20 20  eek(p) ){.      
4610: 20 20 20 20 63 61 73 65 20 27 62 27 3a 20 73 70      case 'b': sp
4620: 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f  ecialOp = RE_OP_
4630: 42 4f 55 4e 44 41 52 59 3b 20 20 20 62 72 65 61  BOUNDARY;   brea
4640: 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 63 61 73  k;.          cas
4650: 65 20 27 64 27 3a 20 73 70 65 63 69 61 6c 4f 70  e 'd': specialOp
4660: 20 3d 20 52 45 5f 4f 50 5f 44 49 47 49 54 3b 20   = RE_OP_DIGIT; 
4670: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
4680: 20 20 20 20 20 20 63 61 73 65 20 27 44 27 3a 20        case 'D': 
4690: 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f  specialOp = RE_O
46a0: 50 5f 4e 4f 54 44 49 47 49 54 3b 20 20 20 62 72  P_NOTDIGIT;   br
46b0: 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 63  eak;.          c
46c0: 61 73 65 20 27 73 27 3a 20 73 70 65 63 69 61 6c  ase 's': special
46d0: 4f 70 20 3d 20 52 45 5f 4f 50 5f 53 50 41 43 45  Op = RE_OP_SPACE
46e0: 3b 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20  ;      break;.  
46f0: 20 20 20 20 20 20 20 20 63 61 73 65 20 27 53 27          case 'S'
4700: 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45  : specialOp = RE
4710: 5f 4f 50 5f 4e 4f 54 53 50 41 43 45 3b 20 20 20  _OP_NOTSPACE;   
4720: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 20  break;.         
4730: 20 63 61 73 65 20 27 77 27 3a 20 73 70 65 63 69   case 'w': speci
4740: 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f 57 4f 52  alOp = RE_OP_WOR
4750: 44 3b 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a  D;       break;.
4760: 20 20 20 20 20 20 20 20 20 20 63 61 73 65 20 27            case '
4770: 57 27 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20  W': specialOp = 
4780: 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 3b 20 20  RE_OP_NOTWORD;  
4790: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20    break;.       
47a0: 20 7d 0a 20 20 20 20 20 20 20 20 69 66 28 20 73   }.        if( s
47b0: 70 65 63 69 61 6c 4f 70 20 29 7b 0a 20 20 20 20  pecialOp ){.    
47c0: 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b        p->sIn.i++
47d0: 3b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61  ;.          re_a
47e0: 70 70 65 6e 64 28 70 2c 20 73 70 65 63 69 61 6c  ppend(p, special
47f0: 4f 70 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20  Op, 0);.        
4800: 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20  }else{.         
4810: 20 63 20 3d 20 72 65 5f 65 73 63 5f 63 68 61 72   c = re_esc_char
4820: 28 70 29 3b 0a 20 20 20 20 20 20 20 20 20 20 72  (p);.          r
4830: 65 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f  e_append(p, RE_O
4840: 50 5f 4d 41 54 43 48 2c 20 63 29 3b 0a 20 20 20  P_MATCH, c);.   
4850: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62       }.        b
4860: 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20  reak;.      }.  
4870: 20 20 20 20 64 65 66 61 75 6c 74 3a 20 7b 0a 20      default: {. 
4880: 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64         re_append
4890: 28 70 2c 20 52 45 5f 4f 50 5f 4d 41 54 43 48 2c  (p, RE_OP_MATCH,
48a0: 20 63 29 3b 0a 20 20 20 20 20 20 20 20 62 72 65   c);.        bre
48b0: 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20  ak;.      }.    
48c0: 7d 0a 20 20 20 20 69 50 72 65 76 20 3d 20 69 53  }.    iPrev = iS
48d0: 74 61 72 74 3b 0a 20 20 7d 0a 20 20 72 65 74 75  tart;.  }.  retu
48e0: 72 6e 20 30 3b 0a 7d 0a 0a 2f 2a 20 46 72 65 65  rn 0;.}../* Free
48f0: 20 61 6e 64 20 72 65 63 6c 61 69 6d 20 61 6c 6c   and reclaim all
4900: 20 74 68 65 20 6d 65 6d 6f 72 79 20 75 73 65 64   the memory used
4910: 20 62 79 20 61 20 70 72 65 76 69 6f 75 73 6c 79   by a previously
4920: 20 63 6f 6d 70 69 6c 65 64 0a 2a 2a 20 72 65 67   compiled.** reg
4930: 75 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 2e  ular expression.
4940: 20 20 41 70 70 6c 69 63 61 74 69 6f 6e 73 20 73    Applications s
4950: 68 6f 75 6c 64 20 69 6e 76 6f 6b 65 20 74 68 69  hould invoke thi
4960: 73 20 72 6f 75 74 69 6e 65 20 6f 6e 63 65 0a 2a  s routine once.*
4970: 2a 20 66 6f 72 20 65 76 65 72 79 20 63 61 6c 6c  * for every call
4980: 20 74 6f 20 72 65 5f 63 6f 6d 70 69 6c 65 28 29   to re_compile()
4990: 20 74 6f 20 61 76 6f 69 64 20 6d 65 6d 6f 72 79   to avoid memory
49a0: 20 6c 65 61 6b 73 2e 0a 2a 2f 0a 76 6f 69 64 20   leaks..*/.void 
49b0: 72 65 5f 66 72 65 65 28 52 65 43 6f 6d 70 69 6c  re_free(ReCompil
49c0: 65 64 20 2a 70 52 65 29 7b 0a 20 20 69 66 28 20  ed *pRe){.  if( 
49d0: 70 52 65 20 29 7b 0a 20 20 20 20 73 71 6c 69 74  pRe ){.    sqlit
49e0: 65 33 5f 66 72 65 65 28 70 52 65 2d 3e 61 4f 70  e3_free(pRe->aOp
49f0: 29 3b 0a 20 20 20 20 73 71 6c 69 74 65 33 5f 66  );.    sqlite3_f
4a00: 72 65 65 28 70 52 65 2d 3e 61 41 72 67 29 3b 0a  ree(pRe->aArg);.
4a10: 20 20 20 20 73 71 6c 69 74 65 33 5f 66 72 65 65      sqlite3_free
4a20: 28 70 52 65 29 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a  (pRe);.  }.}../*
4a30: 0a 2a 2a 20 43 6f 6d 70 69 6c 65 20 61 20 74 65  .** Compile a te
4a40: 78 74 75 61 6c 20 72 65 67 75 6c 61 72 20 65 78  xtual regular ex
4a50: 70 72 65 73 73 69 6f 6e 20 69 6e 20 7a 49 6e 5b  pression in zIn[
4a60: 5d 20 69 6e 74 6f 20 61 20 63 6f 6d 70 69 6c 65  ] into a compile
4a70: 64 20 72 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70  d regular.** exp
4a80: 72 65 73 73 69 6f 6e 20 73 75 69 74 61 62 6c 65  ression suitable
4a90: 20 66 6f 72 20 75 73 20 62 79 20 72 65 5f 6d 61   for us by re_ma
4aa0: 74 63 68 28 29 20 61 6e 64 20 72 65 74 75 72 6e  tch() and return
4ab0: 20 61 20 70 6f 69 6e 74 65 72 20 74 6f 20 74 68   a pointer to th
4ac0: 65 0a 2a 2a 20 63 6f 6d 70 69 6c 65 64 20 72 65  e.** compiled re
4ad0: 67 75 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e  gular expression
4ae0: 20 69 6e 20 2a 70 70 52 65 2e 20 20 52 65 74 75   in *ppRe.  Retu
4af0: 72 6e 20 4e 55 4c 4c 20 6f 6e 20 73 75 63 63 65  rn NULL on succe
4b00: 73 73 20 6f 72 20 61 6e 0a 2a 2a 20 65 72 72 6f  ss or an.** erro
4b10: 72 20 6d 65 73 73 61 67 65 20 69 66 20 73 6f 6d  r message if som
4b20: 65 74 68 69 6e 67 20 67 6f 65 73 20 77 72 6f 6e  ething goes wron
4b30: 67 2e 0a 2a 2f 0a 63 6f 6e 73 74 20 63 68 61 72  g..*/.const char
4b40: 20 2a 72 65 5f 63 6f 6d 70 69 6c 65 28 52 65 43   *re_compile(ReC
4b50: 6f 6d 70 69 6c 65 64 20 2a 2a 70 70 52 65 2c 20  ompiled **ppRe, 
4b60: 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 49 6e 2c  const char *zIn,
4b70: 20 69 6e 74 20 6e 6f 43 61 73 65 29 7b 0a 20 20   int noCase){.  
4b80: 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 52 65 3b  ReCompiled *pRe;
4b90: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a  .  const char *z
4ba0: 45 72 72 3b 0a 20 20 69 6e 74 20 69 2c 20 6a 3b  Err;.  int i, j;
4bb0: 0a 0a 20 20 2a 70 70 52 65 20 3d 20 30 3b 0a 20  ..  *ppRe = 0;. 
4bc0: 20 70 52 65 20 3d 20 73 71 6c 69 74 65 33 5f 6d   pRe = sqlite3_m
4bd0: 61 6c 6c 6f 63 28 20 73 69 7a 65 6f 66 28 2a 70  alloc( sizeof(*p
4be0: 52 65 29 20 29 3b 0a 20 20 69 66 28 20 70 52 65  Re) );.  if( pRe
4bf0: 3d 3d 30 20 29 7b 0a 20 20 20 20 72 65 74 75 72  ==0 ){.    retur
4c00: 6e 20 22 6f 75 74 20 6f 66 20 6d 65 6d 6f 72 79  n "out of memory
4c10: 22 3b 0a 20 20 7d 0a 20 20 6d 65 6d 73 65 74 28  ";.  }.  memset(
4c20: 70 52 65 2c 20 30 2c 20 73 69 7a 65 6f 66 28 2a  pRe, 0, sizeof(*
4c30: 70 52 65 29 29 3b 0a 20 20 70 52 65 2d 3e 78 4e  pRe));.  pRe->xN
4c40: 65 78 74 43 68 61 72 20 3d 20 6e 6f 43 61 73 65  extChar = noCase
4c50: 20 3f 20 72 65 5f 6e 65 78 74 5f 63 68 61 72 5f   ? re_next_char_
4c60: 6e 6f 63 61 73 65 20 3a 20 72 65 5f 6e 65 78 74  nocase : re_next
4c70: 5f 63 68 61 72 3b 0a 20 20 69 66 28 20 72 65 5f  _char;.  if( re_
4c80: 72 65 73 69 7a 65 28 70 52 65 2c 20 33 30 29 20  resize(pRe, 30) 
4c90: 29 7b 0a 20 20 20 20 72 65 5f 66 72 65 65 28 70  ){.    re_free(p
4ca0: 52 65 29 3b 0a 20 20 20 20 72 65 74 75 72 6e 20  Re);.    return 
4cb0: 22 6f 75 74 20 6f 66 20 6d 65 6d 6f 72 79 22 3b  "out of memory";
4cc0: 0a 20 20 7d 0a 20 20 69 66 28 20 7a 49 6e 5b 30  .  }.  if( zIn[0
4cd0: 5d 3d 3d 27 5e 27 20 29 7b 0a 20 20 20 20 7a 49  ]=='^' ){.    zI
4ce0: 6e 2b 2b 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20  n++;.  }else{.  
4cf0: 20 20 72 65 5f 61 70 70 65 6e 64 28 70 52 65 2c    re_append(pRe,
4d00: 20 52 45 5f 4f 50 5f 41 4e 59 53 54 41 52 2c 20   RE_OP_ANYSTAR, 
4d10: 30 29 3b 0a 20 20 7d 0a 20 20 70 52 65 2d 3e 73  0);.  }.  pRe->s
4d20: 49 6e 2e 7a 20 3d 20 28 75 6e 73 69 67 6e 65 64  In.z = (unsigned
4d30: 20 63 68 61 72 2a 29 7a 49 6e 3b 0a 20 20 70 52   char*)zIn;.  pR
4d40: 65 2d 3e 73 49 6e 2e 69 20 3d 20 30 3b 0a 20 20  e->sIn.i = 0;.  
4d50: 70 52 65 2d 3e 73 49 6e 2e 6d 78 20 3d 20 73 74  pRe->sIn.mx = st
4d60: 72 6c 65 6e 28 7a 49 6e 29 3b 0a 20 20 7a 45 72  rlen(zIn);.  zEr
4d70: 72 20 3d 20 72 65 5f 73 75 62 63 6f 6d 70 69 6c  r = re_subcompil
4d80: 65 5f 72 65 28 70 52 65 29 3b 0a 20 20 69 66 28  e_re(pRe);.  if(
4d90: 20 7a 45 72 72 20 29 7b 0a 20 20 20 20 72 65 5f   zErr ){.    re_
4da0: 66 72 65 65 28 70 52 65 29 3b 0a 20 20 20 20 72  free(pRe);.    r
4db0: 65 74 75 72 6e 20 7a 45 72 72 3b 0a 20 20 7d 0a  eturn zErr;.  }.
4dc0: 20 20 69 66 28 20 72 65 50 65 65 6b 28 70 52 65    if( rePeek(pRe
4dd0: 29 3d 3d 27 24 27 20 26 26 20 70 52 65 2d 3e 73  )=='$' && pRe->s
4de0: 49 6e 2e 69 2b 31 3e 3d 70 52 65 2d 3e 73 49 6e  In.i+1>=pRe->sIn
4df0: 2e 6d 78 20 29 7b 0a 20 20 20 20 72 65 5f 61 70  .mx ){.    re_ap
4e00: 70 65 6e 64 28 70 52 65 2c 20 52 45 5f 4f 50 5f  pend(pRe, RE_OP_
4e10: 4d 41 54 43 48 2c 20 52 45 5f 45 4f 46 29 3b 0a  MATCH, RE_EOF);.
4e20: 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 52      re_append(pR
4e30: 65 2c 20 52 45 5f 4f 50 5f 41 43 43 45 50 54 2c  e, RE_OP_ACCEPT,
4e40: 20 30 29 3b 0a 20 20 20 20 2a 70 70 52 65 20 3d   0);.    *ppRe =
4e50: 20 70 52 65 3b 0a 20 20 7d 65 6c 73 65 20 69 66   pRe;.  }else if
4e60: 28 20 70 52 65 2d 3e 73 49 6e 2e 69 3e 3d 70 52  ( pRe->sIn.i>=pR
4e70: 65 2d 3e 73 49 6e 2e 6d 78 20 29 7b 0a 20 20 20  e->sIn.mx ){.   
4e80: 20 72 65 5f 61 70 70 65 6e 64 28 70 52 65 2c 20   re_append(pRe, 
4e90: 52 45 5f 4f 50 5f 41 43 43 45 50 54 2c 20 30 29  RE_OP_ACCEPT, 0)
4ea0: 3b 0a 20 20 20 20 2a 70 70 52 65 20 3d 20 70 52  ;.    *ppRe = pR
4eb0: 65 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20  e;.  }else{.    
4ec0: 72 65 5f 66 72 65 65 28 70 52 65 29 3b 0a 20 20  re_free(pRe);.  
4ed0: 20 20 72 65 74 75 72 6e 20 22 75 6e 72 65 63 6f    return "unreco
4ee0: 67 6e 69 7a 65 64 20 63 68 61 72 61 63 74 65 72  gnized character
4ef0: 22 3b 0a 20 20 7d 0a 0a 20 20 2f 2a 20 54 68 65  ";.  }..  /* The
4f00: 20 66 6f 6c 6c 6f 77 69 6e 67 20 69 73 20 61 20   following is a 
4f10: 70 65 72 66 6f 72 6d 61 6e 63 65 20 6f 70 74 69  performance opti
4f20: 6d 69 7a 61 74 69 6f 6e 2e 20 20 49 66 20 74 68  mization.  If th
4f30: 65 20 72 65 67 65 78 20 62 65 67 69 6e 73 20 77  e regex begins w
4f40: 69 74 68 0a 20 20 2a 2a 20 22 2e 2a 22 20 28 69  ith.  ** ".*" (i
4f50: 66 20 74 68 65 20 69 6e 70 75 74 20 72 65 67 65  f the input rege
4f60: 78 20 6c 61 63 6b 73 20 61 6e 20 69 6e 69 74 69  x lacks an initi
4f70: 61 6c 20 22 5e 22 29 20 61 6e 64 20 61 66 74 65  al "^") and afte
4f80: 72 77 61 72 64 73 20 74 68 65 72 65 20 61 72 65  rwards there are
4f90: 0a 20 20 2a 2a 20 6f 6e 65 20 6f 72 20 6d 6f 72  .  ** one or mor
4fa0: 65 20 6d 61 74 63 68 69 6e 67 20 63 68 61 72 61  e matching chara
4fb0: 63 74 65 72 73 2c 20 65 6e 74 65 72 20 74 68 6f  cters, enter tho
4fc0: 73 65 20 6d 61 74 63 68 69 6e 67 20 63 68 61 72  se matching char
4fd0: 61 63 74 65 72 73 20 69 6e 74 6f 0a 20 20 2a 2a  acters into.  **
4fe0: 20 7a 49 6e 69 74 5b 5d 2e 20 20 54 68 65 20 72   zInit[].  The r
4ff0: 65 5f 6d 61 74 63 68 28 29 20 72 6f 75 74 69 6e  e_match() routin
5000: 65 20 63 61 6e 20 74 68 65 6e 20 73 65 61 72 63  e can then searc
5010: 68 20 61 68 65 61 64 20 69 6e 20 74 68 65 20 69  h ahead in the i
5020: 6e 70 75 74 20 0a 20 20 2a 2a 20 73 74 72 69 6e  nput .  ** strin
5030: 67 20 6c 6f 6f 6b 69 6e 67 20 66 6f 72 20 74 68  g looking for th
5040: 65 20 69 6e 69 74 69 61 6c 20 6d 61 74 63 68 20  e initial match 
5050: 77 69 74 68 6f 75 74 20 68 61 76 69 6e 67 20 74  without having t
5060: 6f 20 72 75 6e 20 74 68 65 20 77 68 6f 6c 65 0a  o run the whole.
5070: 20 20 2a 2a 20 72 65 67 65 78 20 65 6e 67 69 6e    ** regex engin
5080: 65 20 6f 76 65 72 20 74 68 65 20 73 74 72 69 6e  e over the strin
5090: 67 2e 20 20 44 6f 20 6e 6f 74 20 77 6f 72 72 79  g.  Do not worry
50a0: 20 61 62 6c 65 20 74 72 79 69 6e 67 20 74 6f 20   able trying to 
50b0: 6d 61 74 63 68 0a 20 20 2a 2a 20 75 6e 69 63 6f  match.  ** unico
50c0: 64 65 20 63 68 61 72 61 63 74 65 72 73 20 62 65  de characters be
50d0: 79 6f 6e 64 20 70 6c 61 6e 65 20 30 20 2d 20 74  yond plane 0 - t
50e0: 68 6f 73 65 20 61 72 65 20 76 65 72 79 20 72 61  hose are very ra
50f0: 72 65 20 61 6e 64 20 74 68 69 73 20 69 73 0a 20  re and this is. 
5100: 20 2a 2a 20 6a 75 73 74 20 61 6e 20 6f 70 74 69   ** just an opti
5110: 6d 69 7a 61 74 69 6f 6e 2e 20 2a 2f 0a 20 20 69  mization. */.  i
5120: 66 28 20 70 52 65 2d 3e 61 4f 70 5b 30 5d 3d 3d  f( pRe->aOp[0]==
5130: 52 45 5f 4f 50 5f 41 4e 59 53 54 41 52 20 29 7b  RE_OP_ANYSTAR ){
5140: 0a 20 20 20 20 66 6f 72 28 6a 3d 30 2c 20 69 3d  .    for(j=0, i=
5150: 31 3b 20 6a 3c 73 69 7a 65 6f 66 28 70 52 65 2d  1; j<sizeof(pRe-
5160: 3e 7a 49 6e 69 74 29 2d 32 20 26 26 20 70 52 65  >zInit)-2 && pRe
5170: 2d 3e 61 4f 70 5b 69 5d 3d 3d 52 45 5f 4f 50 5f  ->aOp[i]==RE_OP_
5180: 4d 41 54 43 48 3b 20 69 2b 2b 29 7b 0a 20 20 20  MATCH; i++){.   
5190: 20 20 20 75 6e 73 69 67 6e 65 64 20 78 20 3d 20     unsigned x = 
51a0: 70 52 65 2d 3e 61 41 72 67 5b 69 5d 3b 0a 20 20  pRe->aArg[i];.  
51b0: 20 20 20 20 69 66 28 20 78 3c 3d 31 32 37 20 29      if( x<=127 )
51c0: 7b 0a 20 20 20 20 20 20 20 20 70 52 65 2d 3e 7a  {.        pRe->z
51d0: 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 78 3b 0a 20  Init[j++] = x;. 
51e0: 20 20 20 20 20 7d 65 6c 73 65 20 69 66 28 20 78       }else if( x
51f0: 3c 3d 30 78 66 66 66 20 29 7b 0a 20 20 20 20 20  <=0xfff ){.     
5200: 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b     pRe->zInit[j+
5210: 2b 5d 20 3d 20 30 78 63 30 20 7c 20 28 78 3e 3e  +] = 0xc0 | (x>>
5220: 36 29 3b 0a 20 20 20 20 20 20 20 20 70 52 65 2d  6);.        pRe-
5230: 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 30 78  >zInit[j++] = 0x
5240: 38 30 20 7c 20 28 78 26 30 78 33 66 29 3b 0a 20  80 | (x&0x3f);. 
5250: 20 20 20 20 20 7d 65 6c 73 65 20 69 66 28 20 78       }else if( x
5260: 3c 3d 30 78 66 66 66 66 20 29 7b 0a 20 20 20 20  <=0xffff ){.    
5270: 20 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a      pRe->zInit[j
5280: 2b 2b 5d 20 3d 20 30 78 64 30 20 7c 20 28 78 3e  ++] = 0xd0 | (x>
5290: 3e 31 32 29 3b 0a 20 20 20 20 20 20 20 20 70 52  >12);.        pR
52a0: 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20  e->zInit[j++] = 
52b0: 30 78 38 30 20 7c 20 28 28 78 3e 3e 36 29 26 30  0x80 | ((x>>6)&0
52c0: 78 33 66 29 3b 0a 20 20 20 20 20 20 20 20 70 52  x3f);.        pR
52d0: 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20  e->zInit[j++] = 
52e0: 30 78 38 30 20 7c 20 28 78 26 30 78 33 66 29 3b  0x80 | (x&0x3f);
52f0: 0a 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20  .      }else{.  
5300: 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20        break;.   
5310: 20 20 20 7d 0a 20 20 20 20 7d 0a 20 20 20 20 69     }.    }.    i
5320: 66 28 20 6a 3e 30 20 26 26 20 70 52 65 2d 3e 7a  f( j>0 && pRe->z
5330: 49 6e 69 74 5b 6a 2d 31 5d 3d 3d 30 20 29 20 6a  Init[j-1]==0 ) j
5340: 2d 2d 3b 0a 20 20 20 20 70 52 65 2d 3e 6e 49 6e  --;.    pRe->nIn
5350: 69 74 20 3d 20 6a 3b 0a 20 20 7d 0a 20 20 72 65  it = j;.  }.  re
5360: 74 75 72 6e 20 70 52 65 2d 3e 7a 45 72 72 3b 0a  turn pRe->zErr;.
5370: 7d 0a 0a 2f 2a 0a 2a 2a 20 49 6d 70 6c 65 6d 65  }../*.** Impleme
5380: 6e 74 61 74 69 6f 6e 20 6f 66 20 74 68 65 20 72  ntation of the r
5390: 65 67 65 78 70 28 29 20 53 51 4c 20 66 75 6e 63  egexp() SQL func
53a0: 74 69 6f 6e 2e 20 20 54 68 69 73 20 66 75 6e 63  tion.  This func
53b0: 74 69 6f 6e 20 69 6d 70 6c 65 6d 65 6e 74 73 0a  tion implements.
53c0: 2a 2a 20 74 68 65 20 62 75 69 6c 64 2d 69 6e 20  ** the build-in 
53d0: 52 45 47 45 58 50 20 6f 70 65 72 61 74 6f 72 2e  REGEXP operator.
53e0: 20 20 54 68 65 20 66 69 72 73 74 20 61 72 67 75    The first argu
53f0: 6d 65 6e 74 20 74 6f 20 74 68 65 20 66 75 6e 63  ment to the func
5400: 74 69 6f 6e 20 69 73 20 74 68 65 0a 2a 2a 20 70  tion is the.** p
5410: 61 74 74 65 72 6e 20 61 6e 64 20 74 68 65 20 73  attern and the s
5420: 65 63 6f 6e 64 20 61 72 67 75 6d 65 6e 74 20 69  econd argument i
5430: 73 20 74 68 65 20 73 74 72 69 6e 67 2e 20 20 53  s the string.  S
5440: 6f 2c 20 74 68 65 20 53 51 4c 20 73 74 61 74 65  o, the SQL state
5450: 6d 65 6e 74 73 3a 0a 2a 2a 0a 2a 2a 20 20 20 20  ments:.**.**    
5460: 20 20 20 41 20 52 45 47 45 58 50 20 42 0a 2a 2a     A REGEXP B.**
5470: 0a 2a 2a 20 69 73 20 69 6d 70 6c 65 6d 65 6e 74  .** is implement
5480: 65 64 20 61 73 20 72 65 67 65 78 70 28 42 2c 41  ed as regexp(B,A
5490: 29 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 76 6f 69  )..*/.static voi
54a0: 64 20 72 65 5f 73 71 6c 5f 66 75 6e 63 28 0a 20  d re_sql_func(. 
54b0: 20 73 71 6c 69 74 65 33 5f 63 6f 6e 74 65 78 74   sqlite3_context
54c0: 20 2a 63 6f 6e 74 65 78 74 2c 20 0a 20 20 69 6e   *context, .  in
54d0: 74 20 61 72 67 63 2c 20 0a 20 20 73 71 6c 69 74  t argc, .  sqlit
54e0: 65 33 5f 76 61 6c 75 65 20 2a 2a 61 72 67 76 0a  e3_value **argv.
54f0: 29 7b 0a 20 20 52 65 43 6f 6d 70 69 6c 65 64 20  ){.  ReCompiled 
5500: 2a 70 52 65 3b 20 20 20 20 20 20 20 20 20 20 2f  *pRe;          /
5510: 2a 20 43 6f 6d 70 69 6c 65 64 20 72 65 67 75 6c  * Compiled regul
5520: 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20 2a 2f  ar expression */
5530: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a  .  const char *z
5540: 50 61 74 74 65 72 6e 3b 20 20 20 20 20 2f 2a 20  Pattern;     /* 
5550: 54 68 65 20 72 65 67 75 6c 61 72 20 65 78 70 72  The regular expr
5560: 65 73 73 69 6f 6e 20 2a 2f 0a 20 20 63 6f 6e 73  ession */.  cons
5570: 74 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20  t unsigned char 
5580: 2a 7a 53 74 72 3b 2f 2a 20 53 74 72 69 6e 67 20  *zStr;/* String 
5590: 62 65 69 6e 67 20 73 65 61 72 63 68 65 64 20 2a  being searched *
55a0: 2f 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a  /.  const char *
55b0: 7a 45 72 72 3b 20 20 20 20 20 20 20 20 20 2f 2a  zErr;         /*
55c0: 20 43 6f 6d 70 69 6c 65 20 65 72 72 6f 72 20 6d   Compile error m
55d0: 65 73 73 61 67 65 20 2a 2f 0a 0a 20 20 70 52 65  essage */..  pRe
55e0: 20 3d 20 73 71 6c 69 74 65 33 5f 67 65 74 5f 61   = sqlite3_get_a
55f0: 75 78 64 61 74 61 28 63 6f 6e 74 65 78 74 2c 20  uxdata(context, 
5600: 30 29 3b 0a 20 20 69 66 28 20 70 52 65 3d 3d 30  0);.  if( pRe==0
5610: 20 29 7b 0a 20 20 20 20 7a 50 61 74 74 65 72 6e   ){.    zPattern
5620: 20 3d 20 28 63 6f 6e 73 74 20 63 68 61 72 2a 29   = (const char*)
5630: 73 71 6c 69 74 65 33 5f 76 61 6c 75 65 5f 74 65  sqlite3_value_te
5640: 78 74 28 61 72 67 76 5b 30 5d 29 3b 0a 20 20 20  xt(argv[0]);.   
5650: 20 69 66 28 20 7a 50 61 74 74 65 72 6e 3d 3d 30   if( zPattern==0
5660: 20 29 20 72 65 74 75 72 6e 3b 0a 20 20 20 20 7a   ) return;.    z
5670: 45 72 72 20 3d 20 72 65 5f 63 6f 6d 70 69 6c 65  Err = re_compile
5680: 28 26 70 52 65 2c 20 7a 50 61 74 74 65 72 6e 2c  (&pRe, zPattern,
5690: 20 30 29 3b 0a 20 20 20 20 69 66 28 20 7a 45 72   0);.    if( zEr
56a0: 72 20 29 7b 0a 20 20 20 20 20 20 72 65 5f 66 72  r ){.      re_fr
56b0: 65 65 28 70 52 65 29 3b 0a 20 20 20 20 20 20 73  ee(pRe);.      s
56c0: 71 6c 69 74 65 33 5f 72 65 73 75 6c 74 5f 65 72  qlite3_result_er
56d0: 72 6f 72 28 63 6f 6e 74 65 78 74 2c 20 7a 45 72  ror(context, zEr
56e0: 72 2c 20 2d 31 29 3b 0a 20 20 20 20 20 20 72 65  r, -1);.      re
56f0: 74 75 72 6e 3b 0a 20 20 20 20 7d 0a 20 20 20 20  turn;.    }.    
5700: 69 66 28 20 70 52 65 3d 3d 30 20 29 7b 0a 20 20  if( pRe==0 ){.  
5710: 20 20 20 20 73 71 6c 69 74 65 33 5f 72 65 73 75      sqlite3_resu
5720: 6c 74 5f 65 72 72 6f 72 5f 6e 6f 6d 65 6d 28 63  lt_error_nomem(c
5730: 6f 6e 74 65 78 74 29 3b 0a 20 20 20 20 20 20 72  ontext);.      r
5740: 65 74 75 72 6e 3b 0a 20 20 20 20 7d 0a 20 20 20  eturn;.    }.   
5750: 20 73 71 6c 69 74 65 33 5f 73 65 74 5f 61 75 78   sqlite3_set_aux
5760: 64 61 74 61 28 63 6f 6e 74 65 78 74 2c 20 30 2c  data(context, 0,
5770: 20 70 52 65 2c 20 28 76 6f 69 64 28 2a 29 28 76   pRe, (void(*)(v
5780: 6f 69 64 2a 29 29 72 65 5f 66 72 65 65 29 3b 0a  oid*))re_free);.
5790: 20 20 7d 0a 20 20 7a 53 74 72 20 3d 20 28 63 6f    }.  zStr = (co
57a0: 6e 73 74 20 75 6e 73 69 67 6e 65 64 20 63 68 61  nst unsigned cha
57b0: 72 2a 29 73 71 6c 69 74 65 33 5f 76 61 6c 75 65  r*)sqlite3_value
57c0: 5f 74 65 78 74 28 61 72 67 76 5b 31 5d 29 3b 0a  _text(argv[1]);.
57d0: 20 20 69 66 28 20 7a 53 74 72 21 3d 30 20 29 7b    if( zStr!=0 ){
57e0: 0a 20 20 20 20 73 71 6c 69 74 65 33 5f 72 65 73  .    sqlite3_res
57f0: 75 6c 74 5f 69 6e 74 28 63 6f 6e 74 65 78 74 2c  ult_int(context,
5800: 20 72 65 5f 6d 61 74 63 68 28 70 52 65 2c 20 7a   re_match(pRe, z
5810: 53 74 72 2c 20 2d 31 29 29 3b 0a 20 20 7d 0a 7d  Str, -1));.  }.}
5820: 0a 0a 2f 2a 0a 2a 2a 20 49 6e 76 6f 6b 65 20 74  ../*.** Invoke t
5830: 68 69 73 20 72 6f 75 74 69 6e 65 20 69 6e 20 6f  his routine in o
5840: 72 64 65 72 20 74 6f 20 69 6e 73 74 61 6c 6c 20  rder to install 
5850: 74 68 65 20 52 45 47 45 58 50 20 66 75 6e 63 74  the REGEXP funct
5860: 69 6f 6e 20 69 6e 20 61 6e 0a 2a 2a 20 53 51 4c  ion in an.** SQL
5870: 69 74 65 20 64 61 74 61 62 61 73 65 20 63 6f 6e  ite database con
5880: 6e 65 63 74 69 6f 6e 2e 0a 2a 2a 0a 2a 2a 20 55  nection..**.** U
5890: 73 65 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 20 20 73  se:.**.**      s
58a0: 71 6c 69 74 65 33 5f 61 75 74 6f 5f 65 78 74 65  qlite3_auto_exte
58b0: 6e 73 69 6f 6e 28 73 71 6c 69 74 65 33 5f 61 64  nsion(sqlite3_ad
58c0: 64 5f 72 65 67 65 78 70 5f 66 75 6e 63 29 3b 0a  d_regexp_func);.
58d0: 2a 2a 0a 2a 2a 20 74 6f 20 63 61 75 73 65 20 74  **.** to cause t
58e0: 68 69 73 20 65 78 74 65 6e 73 69 6f 6e 20 74 6f  his extension to
58f0: 20 62 65 20 61 75 74 6f 6d 61 74 69 63 61 6c 6c   be automaticall
5900: 79 20 6c 6f 61 64 65 64 20 69 6e 74 6f 20 65 61  y loaded into ea
5910: 63 68 20 6e 65 77 0a 2a 2a 20 64 61 74 61 62 61  ch new.** databa
5920: 73 65 20 63 6f 6e 6e 65 63 74 69 6f 6e 2e 0a 2a  se connection..*
5930: 2f 0a 69 6e 74 20 73 71 6c 69 74 65 33 5f 61 64  /.int sqlite3_ad
5940: 64 5f 72 65 67 65 78 70 5f 66 75 6e 63 28 73 71  d_regexp_func(sq
5950: 6c 69 74 65 33 20 2a 64 62 29 7b 0a 20 20 72 65  lite3 *db){.  re
5960: 74 75 72 6e 20 73 71 6c 69 74 65 33 5f 63 72 65  turn sqlite3_cre
5970: 61 74 65 5f 66 75 6e 63 74 69 6f 6e 28 64 62 2c  ate_function(db,
5980: 20 22 72 65 67 65 78 70 22 2c 20 32 2c 20 53 51   "regexp", 2, SQ
5990: 4c 49 54 45 5f 55 54 46 38 2c 20 30 2c 0a 20 20  LITE_UTF8, 0,.  
59a0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
59b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 72                 r
59c0: 65 5f 73 71 6c 5f 66 75 6e 63 2c 20 30 2c 20 30  e_sql_func, 0, 0
59d0: 29 3b 0a 7d 0a 0a 0a 2f 2a 2a 2a 2a 2a 2a 2a 2a  );.}.../********
59e0: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
59f0: 2a 2a 2a 2a 2a 20 54 65 73 74 20 43 6f 64 65 20  ***** Test Code 
5a00: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
5a10: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
5a20: 2a 2a 2a 2f 0a 23 69 66 64 65 66 20 53 51 4c 49  ***/.#ifdef SQLI
5a30: 54 45 5f 54 45 53 54 0a 23 69 6e 63 6c 75 64 65  TE_TEST.#include
5a40: 20 3c 74 63 6c 2e 68 3e 0a 65 78 74 65 72 6e 20   <tcl.h>.extern 
5a50: 69 6e 74 20 67 65 74 44 62 50 6f 69 6e 74 65 72  int getDbPointer
5a60: 28 54 63 6c 5f 49 6e 74 65 72 70 20 2a 69 6e 74  (Tcl_Interp *int
5a70: 65 72 70 2c 20 63 6f 6e 73 74 20 63 68 61 72 20  erp, const char 
5a80: 2a 7a 41 2c 20 73 71 6c 69 74 65 33 20 2a 2a 70  *zA, sqlite3 **p
5a90: 70 44 62 29 3b 0a 0a 2f 2a 20 49 6d 70 6c 65 6d  pDb);../* Implem
5aa0: 65 6e 74 61 74 69 6f 6e 20 6f 66 20 74 68 65 20  entation of the 
5ab0: 54 43 4c 20 63 6f 6d 6d 61 6e 64 3a 0a 2a 2a 0a  TCL command:.**.
5ac0: 2a 2a 20 20 20 20 20 20 73 71 6c 69 74 65 33 5f  **      sqlite3_
5ad0: 61 64 64 5f 72 65 67 65 78 70 5f 66 75 6e 63 20  add_regexp_func 
5ae0: 24 44 42 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e  $DB.*/.static in
5af0: 74 20 74 63 6c 53 71 6c 69 74 65 33 41 64 64 52  t tclSqlite3AddR
5b00: 65 67 65 78 70 46 75 6e 63 28 0a 20 20 76 6f 69  egexpFunc(.  voi
5b10: 64 20 2a 20 63 6c 69 65 6e 74 44 61 74 61 2c 0a  d * clientData,.
5b20: 20 20 54 63 6c 5f 49 6e 74 65 72 70 20 2a 69 6e    Tcl_Interp *in
5b30: 74 65 72 70 2c 0a 20 20 69 6e 74 20 6f 62 6a 63  terp,.  int objc
5b40: 2c 0a 20 20 54 63 6c 5f 4f 62 6a 20 2a 43 4f 4e  ,.  Tcl_Obj *CON
5b50: 53 54 20 6f 62 6a 76 5b 5d 0a 29 7b 0a 20 20 73  ST objv[].){.  s
5b60: 71 6c 69 74 65 33 20 2a 64 62 3b 0a 20 20 69 66  qlite3 *db;.  if
5b70: 28 20 6f 62 6a 63 21 3d 32 20 29 7b 0a 20 20 20  ( objc!=2 ){.   
5b80: 20 54 63 6c 5f 57 72 6f 6e 67 4e 75 6d 41 72 67   Tcl_WrongNumArg
5b90: 73 28 69 6e 74 65 72 70 2c 20 31 2c 20 6f 62 6a  s(interp, 1, obj
5ba0: 76 2c 20 22 44 42 22 29 3b 0a 20 20 20 20 72 65  v, "DB");.    re
5bb0: 74 75 72 6e 20 54 43 4c 5f 45 52 52 4f 52 3b 0a  turn TCL_ERROR;.
5bc0: 20 20 7d 0a 20 20 69 66 28 20 67 65 74 44 62 50    }.  if( getDbP
5bd0: 6f 69 6e 74 65 72 28 69 6e 74 65 72 70 2c 20 54  ointer(interp, T
5be0: 63 6c 5f 47 65 74 53 74 72 69 6e 67 28 6f 62 6a  cl_GetString(obj
5bf0: 76 5b 31 5d 29 2c 20 26 64 62 29 20 29 20 72 65  v[1]), &db) ) re
5c00: 74 75 72 6e 20 54 43 4c 5f 45 52 52 4f 52 3b 0a  turn TCL_ERROR;.
5c10: 20 20 73 71 6c 69 74 65 33 5f 61 64 64 5f 72 65    sqlite3_add_re
5c20: 67 65 78 70 5f 66 75 6e 63 28 64 62 29 3b 0a 20  gexp_func(db);. 
5c30: 20 72 65 74 75 72 6e 20 54 43 4c 5f 4f 4b 3b 0a   return TCL_OK;.
5c40: 7d 0a 0a 2f 2a 20 52 65 67 69 73 74 65 72 20 74  }../* Register t
5c50: 68 65 20 73 71 6c 69 74 65 33 5f 61 64 64 5f 72  he sqlite3_add_r
5c60: 65 67 65 78 70 5f 66 75 6e 63 20 54 43 4c 20 63  egexp_func TCL c
5c70: 6f 6d 6d 61 6e 64 20 77 69 74 68 20 74 68 65 20  ommand with the 
5c80: 54 43 4c 20 69 6e 74 65 72 70 72 65 74 65 72 2e  TCL interpreter.
5c90: 0a 2a 2f 0a 69 6e 74 20 53 71 6c 69 74 65 74 65  .*/.int Sqlitete
5ca0: 73 74 72 65 67 65 78 70 5f 49 6e 69 74 28 54 63  stregexp_Init(Tc
5cb0: 6c 5f 49 6e 74 65 72 70 20 2a 69 6e 74 65 72 70  l_Interp *interp
5cc0: 29 7b 0a 20 20 54 63 6c 5f 43 72 65 61 74 65 4f  ){.  Tcl_CreateO
5cd0: 62 6a 43 6f 6d 6d 61 6e 64 28 69 6e 74 65 72 70  bjCommand(interp
5ce0: 2c 20 22 73 71 6c 69 74 65 33 5f 61 64 64 5f 72  , "sqlite3_add_r
5cf0: 65 67 65 78 70 5f 66 75 6e 63 22 2c 0a 20 20 20  egexp_func",.   
5d00: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
5d10: 20 20 20 20 74 63 6c 53 71 6c 69 74 65 33 41 64      tclSqlite3Ad
5d20: 64 52 65 67 65 78 70 46 75 6e 63 2c 20 30 2c 20  dRegexpFunc, 0, 
5d30: 30 29 3b 0a 20 20 72 65 74 75 72 6e 20 54 43 4c  0);.  return TCL
5d40: 5f 4f 4b 3b 0a 7d 0a 23 65 6e 64 69 66 20 2f 2a  _OK;.}.#endif /*
5d50: 20 53 51 4c 49 54 45 5f 54 45 53 54 20 2a 2f 0a   SQLITE_TEST */.
5d60: 2f 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  /***************
5d70: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 20 45 6e  ************* En
5d80: 64 20 4f 66 20 54 65 73 74 20 43 6f 64 65 20 2a  d Of Test Code *
5d90: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
5da0: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2f 0a  **************/.