/ Hex Artifact Content
Login

Artifact f32daf8e08466df5e81617f6694e96172d98fcd2:


0000: 2f 2a 0a 2a 2a 20 32 30 31 32 2d 31 31 2d 31 33  /*.** 2012-11-13
0010: 0a 2a 2a 0a 2a 2a 20 54 68 65 20 61 75 74 68 6f  .**.** The autho
0020: 72 20 64 69 73 63 6c 61 69 6d 73 20 63 6f 70 79  r disclaims copy
0030: 72 69 67 68 74 20 74 6f 20 74 68 69 73 20 73 6f  right to this so
0040: 75 72 63 65 20 63 6f 64 65 2e 20 20 49 6e 20 70  urce code.  In p
0050: 6c 61 63 65 20 6f 66 0a 2a 2a 20 61 20 6c 65 67  lace of.** a leg
0060: 61 6c 20 6e 6f 74 69 63 65 2c 20 68 65 72 65 20  al notice, here 
0070: 69 73 20 61 20 62 6c 65 73 73 69 6e 67 3a 0a 2a  is a blessing:.*
0080: 2a 0a 2a 2a 20 20 20 20 4d 61 79 20 79 6f 75 20  *.**    May you 
0090: 64 6f 20 67 6f 6f 64 20 61 6e 64 20 6e 6f 74 20  do good and not 
00a0: 65 76 69 6c 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  evil..**    May 
00b0: 79 6f 75 20 66 69 6e 64 20 66 6f 72 67 69 76 65  you find forgive
00c0: 6e 65 73 73 20 66 6f 72 20 79 6f 75 72 73 65 6c  ness for yoursel
00d0: 66 20 61 6e 64 20 66 6f 72 67 69 76 65 20 6f 74  f and forgive ot
00e0: 68 65 72 73 2e 0a 2a 2a 20 20 20 20 4d 61 79 20  hers..**    May 
00f0: 79 6f 75 20 73 68 61 72 65 20 66 72 65 65 6c 79  you share freely
0100: 2c 20 6e 65 76 65 72 20 74 61 6b 69 6e 67 20 6d  , never taking m
0110: 6f 72 65 20 74 68 61 6e 20 79 6f 75 20 67 69 76  ore than you giv
0120: 65 2e 0a 2a 2a 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  e..**.**********
0130: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0140: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0150: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0160: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0170: 2a 2a 2a 2a 0a 2a 2a 0a 2a 2a 20 54 68 65 20 63  ****.**.** The c
0180: 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c 65  ode in this file
0190: 20 69 6d 70 6c 65 6d 65 6e 74 73 20 61 20 63 6f   implements a co
01a0: 6d 70 61 63 74 20 62 75 74 20 72 65 61 73 6f 6e  mpact but reason
01b0: 61 62 6c 79 0a 2a 2a 20 65 66 66 69 63 69 65 6e  ably.** efficien
01c0: 74 20 72 65 67 75 6c 61 72 2d 65 78 70 72 65 73  t regular-expres
01d0: 73 69 6f 6e 20 6d 61 74 63 68 65 72 20 66 6f 72  sion matcher for
01e0: 20 70 6f 73 69 78 20 65 78 74 65 6e 64 65 64 20   posix extended 
01f0: 72 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70 72 65  regular.** expre
0200: 73 73 69 6f 6e 73 20 61 67 61 69 6e 73 74 20 55  ssions against U
0210: 54 46 38 20 74 65 78 74 2e 20 20 54 68 65 20 66  TF8 text.  The f
0220: 6f 6c 6c 6f 77 69 6e 67 20 73 79 6e 74 61 78 20  ollowing syntax 
0230: 69 73 20 73 75 70 70 6f 72 74 65 64 3a 0a 2a 2a  is supported:.**
0240: 0a 2a 2a 20 20 20 20 20 58 2a 20 20 20 20 20 20  .**     X*      
0250: 7a 65 72 6f 20 6f 72 20 6d 6f 72 65 20 6f 63 63  zero or more occ
0260: 75 72 72 65 6e 63 65 73 20 6f 66 20 58 0a 2a 2a  urrences of X.**
0270: 20 20 20 20 20 58 2b 20 20 20 20 20 20 6f 6e 65       X+      one
0280: 20 6f 72 20 6d 6f 72 65 20 6f 63 63 75 72 72 65   or more occurre
0290: 6e 63 65 73 20 6f 66 20 58 0a 2a 2a 20 20 20 20  nces of X.**    
02a0: 20 58 3f 20 20 20 20 20 20 7a 65 72 6f 20 6f 72   X?      zero or
02b0: 20 6f 6e 65 20 6f 63 63 75 72 72 65 6e 63 65 73   one occurrences
02c0: 20 6f 66 20 58 0a 2a 2a 20 20 20 20 20 58 7b 70   of X.**     X{p
02d0: 2c 71 7d 20 20 62 65 74 77 65 65 6e 20 70 20 61  ,q}  between p a
02e0: 6e 64 20 71 20 6f 63 63 75 72 72 65 6e 63 65 73  nd q occurrences
02f0: 20 6f 66 20 58 0a 2a 2a 20 20 20 20 20 28 58 29   of X.**     (X)
0300: 20 20 20 20 20 6d 61 74 63 68 20 58 0a 2a 2a 20       match X.** 
0310: 20 20 20 20 58 7c 59 20 20 20 20 20 58 20 6f 72      X|Y     X or
0320: 20 59 0a 2a 2a 20 20 20 20 20 5e 58 20 20 20 20   Y.**     ^X    
0330: 20 20 58 20 6f 63 63 75 72 72 69 6e 67 20 61 74    X occurring at
0340: 20 74 68 65 20 62 65 67 69 6e 6e 69 6e 67 20 6f   the beginning o
0350: 66 20 74 68 65 20 73 74 72 69 6e 67 0a 2a 2a 20  f the string.** 
0360: 20 20 20 20 58 24 20 20 20 20 20 20 58 20 6f 63      X$      X oc
0370: 63 75 72 72 69 6e 67 20 61 74 20 74 68 65 20 65  curring at the e
0380: 6e 64 20 6f 66 20 74 68 65 20 73 74 72 69 6e 67  nd of the string
0390: 0a 2a 2a 20 20 20 20 20 2e 20 20 20 20 20 20 20  .**     .       
03a0: 4d 61 74 63 68 20 61 6e 79 20 73 69 6e 67 6c 65  Match any single
03b0: 20 63 68 61 72 61 63 74 65 72 0a 2a 2a 20 20 20   character.**   
03c0: 20 20 5c 63 20 20 20 20 20 20 43 68 61 72 61 63    \c      Charac
03d0: 74 65 72 20 63 20 77 68 65 72 65 20 63 20 69 73  ter c where c is
03e0: 20 6f 6e 65 20 6f 66 20 5c 7b 7d 28 29 5b 5d 7c   one of \{}()[]|
03f0: 2a 2b 3f 2e 0a 2a 2a 20 20 20 20 20 5c 63 20 20  *+?..**     \c  
0400: 20 20 20 20 43 2d 6c 61 6e 67 75 61 67 65 20 65      C-language e
0410: 73 63 61 70 65 73 20 66 6f 72 20 63 20 69 6e 20  scapes for c in 
0420: 61 66 6e 72 74 76 2e 20 20 65 78 3a 20 5c 74 20  afnrtv.  ex: \t 
0430: 6f 72 20 5c 6e 0a 2a 2a 20 20 20 20 20 5c 75 58  or \n.**     \uX
0440: 58 58 58 20 20 57 68 65 72 65 20 58 58 58 58 20  XXX  Where XXXX 
0450: 69 73 20 65 78 61 63 74 6c 79 20 34 20 68 65 78  is exactly 4 hex
0460: 20 64 69 67 69 74 73 2c 20 75 6e 69 63 6f 64 65   digits, unicode
0470: 20 76 61 6c 75 65 20 58 58 58 58 0a 2a 2a 20 20   value XXXX.**  
0480: 20 20 20 5c 78 58 58 58 20 20 20 57 68 65 72 65     \xXXX   Where
0490: 20 58 58 58 20 69 73 20 61 6e 79 20 6e 75 6d 62   XXX is any numb
04a0: 65 72 20 6f 66 20 68 65 78 20 64 69 67 69 74 73  er of hex digits
04b0: 2c 20 75 6e 69 63 6f 64 65 20 76 61 6c 75 65 20  , unicode value 
04c0: 58 58 58 0a 2a 2a 20 20 20 20 20 5b 61 62 63 5d  XXX.**     [abc]
04d0: 20 20 20 41 6e 79 20 73 69 6e 67 6c 65 20 63 68     Any single ch
04e0: 61 72 61 63 74 65 72 20 66 72 6f 6d 20 74 68 65  aracter from the
04f0: 20 73 65 74 20 61 62 63 0a 2a 2a 20 20 20 20 20   set abc.**     
0500: 5b 5e 61 62 63 5d 20 20 41 6e 79 20 73 69 6e 67  [^abc]  Any sing
0510: 6c 65 20 63 68 61 72 61 63 74 65 72 20 6e 6f 74  le character not
0520: 20 69 6e 20 74 68 65 20 73 65 74 20 61 62 63 0a   in the set abc.
0530: 2a 2a 20 20 20 20 20 5b 61 2d 7a 5d 20 20 20 41  **     [a-z]   A
0540: 6e 79 20 73 69 6e 67 6c 65 20 63 68 61 72 61 63  ny single charac
0550: 74 65 72 20 69 6e 20 74 68 65 20 72 61 6e 67 65  ter in the range
0560: 20 61 2d 7a 0a 2a 2a 20 20 20 20 20 5b 5e 61 2d   a-z.**     [^a-
0570: 7a 5d 20 20 41 6e 79 20 73 69 6e 67 6c 65 20 63  z]  Any single c
0580: 68 61 72 61 63 74 65 72 20 6e 6f 74 20 69 6e 20  haracter not in 
0590: 74 68 65 20 72 61 6e 67 65 20 61 2d 7a 0a 2a 2a  the range a-z.**
05a0: 20 20 20 20 20 5c 62 20 20 20 20 20 20 57 6f 72       \b      Wor
05b0: 64 20 62 6f 75 6e 64 61 72 79 0a 2a 2a 20 20 20  d boundary.**   
05c0: 20 20 5c 77 20 20 20 20 20 20 57 6f 72 64 20 63    \w      Word c
05d0: 68 61 72 61 63 74 65 72 2e 20 20 5b 41 2d 5a 61  haracter.  [A-Za
05e0: 2d 7a 30 2d 39 5f 5d 0a 2a 2a 20 20 20 20 20 5c  -z0-9_].**     \
05f0: 57 20 20 20 20 20 20 4e 6f 6e 2d 77 6f 72 64 20  W      Non-word 
0600: 63 68 61 72 61 63 74 65 72 0a 2a 2a 20 20 20 20  character.**    
0610: 20 5c 64 20 20 20 20 20 20 44 69 67 69 74 0a 2a   \d      Digit.*
0620: 2a 20 20 20 20 20 5c 44 20 20 20 20 20 20 4e 6f  *     \D      No
0630: 6e 2d 64 69 67 69 74 0a 2a 2a 20 20 20 20 20 5c  n-digit.**     \
0640: 73 20 20 20 20 20 20 57 68 69 74 65 73 70 61 63  s      Whitespac
0650: 65 20 63 68 61 72 61 63 74 65 72 0a 2a 2a 20 20  e character.**  
0660: 20 20 20 5c 53 20 20 20 20 20 20 4e 6f 6e 2d 77     \S      Non-w
0670: 68 69 74 65 73 70 61 63 65 20 63 68 61 72 61 63  hitespace charac
0680: 74 65 72 0a 2a 2a 0a 2a 2a 20 41 20 6e 6f 6e 64  ter.**.** A nond
0690: 65 74 65 72 6d 69 6e 69 73 74 69 63 20 66 69 6e  eterministic fin
06a0: 69 74 65 20 61 75 74 6f 6d 61 74 6f 6e 20 28 4e  ite automaton (N
06b0: 46 41 29 20 69 73 20 75 73 65 64 20 66 6f 72 20  FA) is used for 
06c0: 6d 61 74 63 68 69 6e 67 2c 20 73 6f 20 74 68 65  matching, so the
06d0: 0a 2a 2a 20 70 65 72 66 6f 72 6d 61 6e 63 65 20  .** performance 
06e0: 69 73 20 62 6f 75 6e 64 65 64 20 62 79 20 4f 28  is bounded by O(
06f0: 4e 2a 4d 29 20 77 68 65 72 65 20 4e 20 69 73 20  N*M) where N is 
0700: 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 65 20  the size of the 
0710: 72 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70 72 65  regular.** expre
0720: 73 73 69 6f 6e 20 61 6e 64 20 4d 20 69 73 20 74  ssion and M is t
0730: 68 65 20 73 69 7a 65 20 6f 66 20 74 68 65 20 69  he size of the i
0740: 6e 70 75 74 20 73 74 72 69 6e 67 2e 20 20 54 68  nput string.  Th
0750: 65 20 6d 61 74 63 68 65 72 20 6e 65 76 65 72 0a  e matcher never.
0760: 2a 2a 20 65 78 68 69 62 69 74 73 20 65 78 70 6f  ** exhibits expo
0770: 6e 65 6e 74 69 61 6c 20 62 65 68 61 76 69 6f 72  nential behavior
0780: 2e 20 20 4e 6f 74 65 20 74 68 61 74 20 74 68 65  .  Note that the
0790: 20 58 7b 70 2c 71 7d 20 6f 70 65 72 61 74 6f 72   X{p,q} operator
07a0: 20 65 78 70 61 6e 64 73 0a 2a 2a 20 74 6f 20 70   expands.** to p
07b0: 20 63 6f 70 69 65 73 20 6f 66 20 58 20 66 6f 6c   copies of X fol
07c0: 6c 6f 77 69 6e 67 20 62 79 20 71 2d 70 20 63 6f  lowing by q-p co
07d0: 70 69 65 73 20 6f 66 20 58 3f 20 61 6e 64 20 74  pies of X? and t
07e0: 68 61 74 20 74 68 65 20 73 69 7a 65 20 6f 66 20  hat the size of 
07f0: 74 68 65 0a 2a 2a 20 72 65 67 75 6c 61 72 20 65  the.** regular e
0800: 78 70 72 65 73 73 69 6f 6e 20 69 6e 20 74 68 65  xpression in the
0810: 20 4f 28 4e 2a 4d 29 20 70 65 72 66 6f 72 6d 61   O(N*M) performa
0820: 6e 63 65 20 62 6f 75 6e 64 20 69 73 20 63 6f 6d  nce bound is com
0830: 70 75 74 65 64 20 61 66 74 65 72 0a 2a 2a 20 74  puted after.** t
0840: 68 69 73 20 65 78 70 61 6e 73 69 6f 6e 2e 0a 2a  his expansion..*
0850: 2f 0a 23 69 6e 63 6c 75 64 65 20 3c 73 74 72 69  /.#include <stri
0860: 6e 67 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c  ng.h>.#include <
0870: 73 74 64 6c 69 62 2e 68 3e 0a 23 69 6e 63 6c 75  stdlib.h>.#inclu
0880: 64 65 20 22 73 71 6c 69 74 65 33 2e 68 22 0a 0a  de "sqlite3.h"..
0890: 2f 2a 20 54 68 65 20 65 6e 64 2d 6f 66 2d 69 6e  /* The end-of-in
08a0: 70 75 74 20 63 68 61 72 61 63 74 65 72 20 2a 2f  put character */
08b0: 0a 23 64 65 66 69 6e 65 20 52 45 5f 45 4f 46 20  .#define RE_EOF 
08c0: 20 20 20 20 20 20 20 20 20 20 20 30 20 20 20 20             0    
08d0: 2f 2a 20 45 6e 64 20 6f 66 20 69 6e 70 75 74 20  /* End of input 
08e0: 2a 2f 0a 0a 2f 2a 20 54 68 65 20 4e 46 41 20 69  */../* The NFA i
08f0: 73 20 69 6d 70 6c 65 6d 65 6e 74 65 64 20 61 73  s implemented as
0900: 20 73 65 71 75 65 6e 63 65 20 6f 66 20 6f 70 63   sequence of opc
0910: 6f 64 65 73 20 74 61 6b 65 6e 20 66 72 6f 6d 20  odes taken from 
0920: 74 68 65 20 66 6f 6c 6c 6f 77 69 6e 67 0a 2a 2a  the following.**
0930: 20 73 65 74 2e 20 20 45 61 63 68 20 6f 70 63 6f   set.  Each opco
0940: 64 65 20 68 61 73 20 61 20 73 69 6e 67 6c 65 20  de has a single 
0950: 69 6e 74 65 67 65 72 20 61 72 67 75 6d 65 6e 74  integer argument
0960: 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f  ..*/.#define RE_
0970: 4f 50 5f 4d 41 54 43 48 20 20 20 20 20 20 20 31  OP_MATCH       1
0980: 20 20 20 20 2f 2a 20 4d 61 74 63 68 20 74 68 65      /* Match the
0990: 20 6f 6e 65 20 63 68 61 72 61 63 74 65 72 20 69   one character i
09a0: 6e 20 74 68 65 20 61 72 67 75 6d 65 6e 74 20 2a  n the argument *
09b0: 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f  /.#define RE_OP_
09c0: 41 4e 59 20 20 20 20 20 20 20 20 20 32 20 20 20  ANY         2   
09d0: 20 2f 2a 20 4d 61 74 63 68 20 61 6e 79 20 6f 6e   /* Match any on
09e0: 65 20 63 68 61 72 61 63 74 65 72 2e 20 20 28 49  e character.  (I
09f0: 6d 70 6c 65 6d 65 6e 74 73 20 22 2e 22 29 20 2a  mplements ".") *
0a00: 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f  /.#define RE_OP_
0a10: 41 4e 59 53 54 41 52 20 20 20 20 20 33 20 20 20  ANYSTAR     3   
0a20: 20 2f 2a 20 53 70 65 63 69 61 6c 20 6f 70 74 69   /* Special opti
0a30: 6d 69 7a 65 64 20 76 65 72 73 69 6f 6e 20 6f 66  mized version of
0a40: 20 2e 2a 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52   .* */.#define R
0a50: 45 5f 4f 50 5f 46 4f 52 4b 20 20 20 20 20 20 20  E_OP_FORK       
0a60: 20 34 20 20 20 20 2f 2a 20 43 6f 6e 74 69 6e 75   4    /* Continu
0a70: 65 20 74 6f 20 62 6f 74 68 20 6e 65 78 74 20 61  e to both next a
0a80: 6e 64 20 6f 70 63 6f 64 65 20 61 74 20 69 41 72  nd opcode at iAr
0a90: 67 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f  g */.#define RE_
0aa0: 4f 50 5f 47 4f 54 4f 20 20 20 20 20 20 20 20 35  OP_GOTO        5
0ab0: 20 20 20 20 2f 2a 20 4a 75 6d 70 20 74 6f 20 6f      /* Jump to o
0ac0: 70 63 6f 64 65 20 61 74 20 69 41 72 67 20 2a 2f  pcode at iArg */
0ad0: 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 41  .#define RE_OP_A
0ae0: 43 43 45 50 54 20 20 20 20 20 20 36 20 20 20 20  CCEPT      6    
0af0: 2f 2a 20 48 61 6c 74 20 61 6e 64 20 69 6e 64 69  /* Halt and indi
0b00: 63 61 74 65 20 61 20 73 75 63 63 65 73 73 66 75  cate a successfu
0b10: 6c 20 6d 61 74 63 68 20 2a 2f 0a 23 64 65 66 69  l match */.#defi
0b20: 6e 65 20 52 45 5f 4f 50 5f 43 43 5f 49 4e 43 20  ne RE_OP_CC_INC 
0b30: 20 20 20 20 20 37 20 20 20 20 2f 2a 20 42 65 67       7    /* Beg
0b40: 69 6e 6e 69 6e 67 20 6f 66 20 61 20 5b 2e 2e 2e  inning of a [...
0b50: 5d 20 63 68 61 72 61 63 74 65 72 20 63 6c 61 73  ] character clas
0b60: 73 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f  s */.#define RE_
0b70: 4f 50 5f 43 43 5f 45 58 43 20 20 20 20 20 20 38  OP_CC_EXC      8
0b80: 20 20 20 20 2f 2a 20 42 65 67 69 6e 6e 69 6e 67      /* Beginning
0b90: 20 6f 66 20 61 20 5b 5e 2e 2e 2e 5d 20 63 68 61   of a [^...] cha
0ba0: 72 61 63 74 65 72 20 63 6c 61 73 73 20 2a 2f 0a  racter class */.
0bb0: 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 43 43  #define RE_OP_CC
0bc0: 5f 56 41 4c 55 45 20 20 20 20 39 20 20 20 20 2f  _VALUE    9    /
0bd0: 2a 20 53 69 6e 67 6c 65 20 76 61 6c 75 65 20 69  * Single value i
0be0: 6e 20 61 20 63 68 61 72 61 63 74 65 72 20 63 6c  n a character cl
0bf0: 61 73 73 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  ass */.#define R
0c00: 45 5f 4f 50 5f 43 43 5f 52 41 4e 47 45 20 20 20  E_OP_CC_RANGE   
0c10: 31 30 20 20 20 20 2f 2a 20 52 61 6e 67 65 20 6f  10    /* Range o
0c20: 66 20 76 61 6c 75 65 73 20 69 6e 20 61 20 63 68  f values in a ch
0c30: 61 72 61 63 74 65 72 20 63 6c 61 73 73 20 2a 2f  aracter class */
0c40: 0a 23 64 65 66 69 6e 65 20 52 45 5f 4f 50 5f 57  .#define RE_OP_W
0c50: 4f 52 44 20 20 20 20 20 20 20 31 31 20 20 20 20  ORD       11    
0c60: 2f 2a 20 50 65 72 6c 20 77 6f 72 64 20 63 68 61  /* Perl word cha
0c70: 72 61 63 74 65 72 20 5b 41 2d 5a 61 2d 7a 30 2d  racter [A-Za-z0-
0c80: 39 5f 5d 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52  9_] */.#define R
0c90: 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44 20 20 20 20  E_OP_NOTWORD    
0ca0: 31 32 20 20 20 20 2f 2a 20 4e 6f 74 20 61 20 70  12    /* Not a p
0cb0: 65 72 6c 20 77 6f 72 64 20 63 68 61 72 61 63 74  erl word charact
0cc0: 65 72 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45  er */.#define RE
0cd0: 5f 4f 50 5f 44 49 47 49 54 20 20 20 20 20 20 31  _OP_DIGIT      1
0ce0: 33 20 20 20 20 2f 2a 20 64 69 67 69 74 3a 20 20  3    /* digit:  
0cf0: 5b 30 2d 39 5d 20 2a 2f 0a 23 64 65 66 69 6e 65  [0-9] */.#define
0d00: 20 52 45 5f 4f 50 5f 4e 4f 54 44 49 47 49 54 20   RE_OP_NOTDIGIT 
0d10: 20 20 31 34 20 20 20 20 2f 2a 20 4e 6f 74 20 61    14    /* Not a
0d20: 20 64 69 67 69 74 20 2a 2f 0a 23 64 65 66 69 6e   digit */.#defin
0d30: 65 20 52 45 5f 4f 50 5f 53 50 41 43 45 20 20 20  e RE_OP_SPACE   
0d40: 20 20 20 31 35 20 20 20 20 2f 2a 20 73 70 61 63     15    /* spac
0d50: 65 3a 20 20 5b 20 5c 74 5c 6e 5c 72 5c 76 5c 66  e:  [ \t\n\r\v\f
0d60: 5d 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45 5f  ] */.#define RE_
0d70: 4f 50 5f 4e 4f 54 53 50 41 43 45 20 20 20 31 36  OP_NOTSPACE   16
0d80: 20 20 20 20 2f 2a 20 4e 6f 74 20 61 20 64 69 67      /* Not a dig
0d90: 69 74 20 2a 2f 0a 23 64 65 66 69 6e 65 20 52 45  it */.#define RE
0da0: 5f 4f 50 5f 42 4f 55 4e 44 41 52 59 20 20 20 31  _OP_BOUNDARY   1
0db0: 37 20 20 20 20 2f 2a 20 42 6f 75 6e 64 61 72 79  7    /* Boundary
0dc0: 20 62 65 74 77 65 65 6e 20 77 6f 72 64 20 61 6e   between word an
0dd0: 64 20 6e 6f 6e 2d 77 6f 72 64 20 2a 2f 0a 0a 2f  d non-word */../
0de0: 2a 20 45 61 63 68 20 6f 70 63 6f 64 65 20 69 73  * Each opcode is
0df0: 20 61 20 22 73 74 61 74 65 22 20 69 6e 20 74 68   a "state" in th
0e00: 65 20 4e 46 41 20 2a 2f 0a 74 79 70 65 64 65 66  e NFA */.typedef
0e10: 20 75 6e 73 69 67 6e 65 64 20 73 68 6f 72 74 20   unsigned short 
0e20: 52 65 53 74 61 74 65 4e 75 6d 62 65 72 3b 0a 0a  ReStateNumber;..
0e30: 2f 2a 20 42 65 63 61 75 73 65 20 74 68 69 73 20  /* Because this 
0e40: 69 73 20 61 6e 20 4e 46 41 20 61 6e 64 20 6e 6f  is an NFA and no
0e50: 74 20 61 20 44 46 41 2c 20 6d 75 6c 74 69 70 6c  t a DFA, multipl
0e60: 65 20 73 74 61 74 65 73 20 63 61 6e 20 62 65 20  e states can be 
0e70: 61 63 74 69 76 65 20 61 74 0a 2a 2a 20 6f 6e 63  active at.** onc
0e80: 65 2e 20 20 41 6e 20 69 6e 73 74 61 6e 63 65 20  e.  An instance 
0e90: 6f 66 20 74 68 65 20 66 6f 6c 6c 6f 77 69 6e 67  of the following
0ea0: 20 6f 62 6a 65 63 74 20 72 65 63 6f 72 64 73 20   object records 
0eb0: 61 6c 6c 20 61 63 74 69 76 65 20 73 74 61 74 65  all active state
0ec0: 73 20 69 6e 0a 2a 2a 20 74 68 65 20 4e 46 41 2e  s in.** the NFA.
0ed0: 20 20 54 68 65 20 69 6d 70 6c 65 6d 65 6e 74 61    The implementa
0ee0: 74 69 6f 6e 20 69 73 20 6f 70 74 69 6d 69 7a 65  tion is optimize
0ef0: 64 20 66 6f 72 20 74 68 65 20 63 6f 6d 6d 6f 6e  d for the common
0f00: 20 63 61 73 65 20 77 68 65 72 65 20 74 68 65 0a   case where the.
0f10: 2a 2a 20 6e 75 6d 62 65 72 20 6f 66 20 61 63 74  ** number of act
0f20: 69 76 65 73 20 73 74 61 74 65 73 20 69 73 20 73  ives states is s
0f30: 6d 61 6c 6c 2e 0a 2a 2f 0a 74 79 70 65 64 65 66  mall..*/.typedef
0f40: 20 73 74 72 75 63 74 20 52 65 53 74 61 74 65 53   struct ReStateS
0f50: 65 74 20 7b 0a 20 20 75 6e 73 69 67 6e 65 64 20  et {.  unsigned 
0f60: 6e 53 74 61 74 65 3b 20 20 20 20 20 20 20 20 20  nState;         
0f70: 20 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f 66 20     /* Number of 
0f80: 63 75 72 72 65 6e 74 20 73 74 61 74 65 73 20 2a  current states *
0f90: 2f 0a 20 20 52 65 53 74 61 74 65 4e 75 6d 62 65  /.  ReStateNumbe
0fa0: 72 20 2a 61 53 74 61 74 65 3b 20 20 20 20 20 20  r *aState;      
0fb0: 2f 2a 20 43 75 72 72 65 6e 74 20 73 74 61 74 65  /* Current state
0fc0: 73 20 2a 2f 0a 7d 20 52 65 53 74 61 74 65 53 65  s */.} ReStateSe
0fd0: 74 3b 0a 0a 2f 2a 20 41 6e 20 69 6e 70 75 74 20  t;../* An input 
0fe0: 73 74 72 69 6e 67 20 72 65 61 64 20 6f 6e 65 20  string read one 
0ff0: 63 68 61 72 61 63 74 65 72 20 61 74 20 61 20 74  character at a t
1000: 69 6d 65 2e 0a 2a 2f 0a 74 79 70 65 64 65 66 20  ime..*/.typedef 
1010: 73 74 72 75 63 74 20 52 65 49 6e 70 75 74 20 52  struct ReInput R
1020: 65 49 6e 70 75 74 3b 0a 73 74 72 75 63 74 20 52  eInput;.struct R
1030: 65 49 6e 70 75 74 20 7b 0a 20 20 63 6f 6e 73 74  eInput {.  const
1040: 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a   unsigned char *
1050: 7a 3b 20 20 2f 2a 20 41 6c 6c 20 74 65 78 74 20  z;  /* All text 
1060: 2a 2f 0a 20 20 69 6e 74 20 69 3b 20 20 20 20 20  */.  int i;     
1070: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 2f 2a                /*
1080: 20 4e 65 78 74 20 62 79 74 65 20 74 6f 20 72 65   Next byte to re
1090: 61 64 20 2a 2f 0a 20 20 69 6e 74 20 6d 78 3b 20  ad */.  int mx; 
10a0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
10b0: 20 2f 2a 20 45 4f 46 20 77 68 65 6e 20 69 3e 3d   /* EOF when i>=
10c0: 6d 78 20 2a 2f 0a 7d 3b 0a 0a 2f 2a 20 41 20 63  mx */.};../* A c
10d0: 6f 6d 70 69 6c 65 64 20 4e 46 41 20 28 6f 72 20  ompiled NFA (or 
10e0: 61 6e 20 4e 46 41 20 74 68 61 74 20 69 73 20 69  an NFA that is i
10f0: 6e 20 74 68 65 20 70 72 6f 63 65 73 73 20 6f 66  n the process of
1100: 20 62 65 69 6e 67 20 63 6f 6d 70 69 6c 65 64 29   being compiled)
1110: 20 69 73 0a 2a 2a 20 61 6e 20 69 6e 73 74 61 6e   is.** an instan
1120: 63 65 20 6f 66 20 74 68 65 20 66 6f 6c 6c 6f 77  ce of the follow
1130: 69 6e 67 20 6f 62 6a 65 63 74 2e 0a 2a 2f 0a 74  ing object..*/.t
1140: 79 70 65 64 65 66 20 73 74 72 75 63 74 20 52 65  ypedef struct Re
1150: 43 6f 6d 70 69 6c 65 64 20 52 65 43 6f 6d 70 69  Compiled ReCompi
1160: 6c 65 64 3b 0a 73 74 72 75 63 74 20 52 65 43 6f  led;.struct ReCo
1170: 6d 70 69 6c 65 64 20 7b 0a 20 20 52 65 49 6e 70  mpiled {.  ReInp
1180: 75 74 20 73 49 6e 3b 20 20 20 20 20 20 20 20 20  ut sIn;         
1190: 20 20 20 20 20 20 20 2f 2a 20 52 65 67 75 6c 61         /* Regula
11a0: 72 20 65 78 70 72 65 73 73 69 6f 6e 20 74 65 78  r expression tex
11b0: 74 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63 68 61  t */.  const cha
11c0: 72 20 2a 7a 45 72 72 3b 20 20 20 20 20 20 20 20  r *zErr;        
11d0: 20 20 20 2f 2a 20 45 72 72 6f 72 20 6d 65 73 73     /* Error mess
11e0: 61 67 65 20 74 6f 20 72 65 74 75 72 6e 20 2a 2f  age to return */
11f0: 0a 20 20 63 68 61 72 20 2a 61 4f 70 3b 20 20 20  .  char *aOp;   
1200: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 2f                 /
1210: 2a 20 4f 70 65 72 61 74 6f 72 73 20 66 6f 72 20  * Operators for 
1220: 74 68 65 20 76 69 72 74 75 61 6c 20 6d 61 63 68  the virtual mach
1230: 69 6e 65 20 2a 2f 0a 20 20 69 6e 74 20 2a 61 41  ine */.  int *aA
1240: 72 67 3b 20 20 20 20 20 20 20 20 20 20 20 20 20  rg;             
1250: 20 20 20 20 20 2f 2a 20 41 72 67 75 6d 65 6e 74       /* Argument
1260: 73 20 74 6f 20 65 61 63 68 20 6f 70 65 72 61 74  s to each operat
1270: 6f 72 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64  or */.  unsigned
1280: 20 28 2a 78 4e 65 78 74 43 68 61 72 29 28 52 65   (*xNextChar)(Re
1290: 49 6e 70 75 74 2a 29 3b 20 20 2f 2a 20 4e 65 78  Input*);  /* Nex
12a0: 74 20 63 68 61 72 61 63 74 65 72 20 66 75 6e 63  t character func
12b0: 74 69 6f 6e 20 2a 2f 0a 20 20 63 68 61 72 20 7a  tion */.  char z
12c0: 49 6e 69 74 5b 31 32 5d 3b 20 20 20 20 20 20 20  Init[12];       
12d0: 20 20 20 20 20 20 2f 2a 20 49 6e 69 74 69 61 6c        /* Initial
12e0: 20 74 65 78 74 20 74 6f 20 6d 61 74 63 68 20 2a   text to match *
12f0: 2f 0a 20 20 69 6e 74 20 6e 49 6e 69 74 3b 20 20  /.  int nInit;  
1300: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1310: 2f 2a 20 4e 75 6d 62 65 72 20 6f 66 20 63 68 61  /* Number of cha
1320: 72 61 63 74 65 72 73 20 69 6e 20 7a 49 6e 69 74  racters in zInit
1330: 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64 20 6e   */.  unsigned n
1340: 53 74 61 74 65 3b 20 20 20 20 20 20 20 20 20 20  State;          
1350: 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f 66 20 65    /* Number of e
1360: 6e 74 72 69 65 73 20 69 6e 20 61 4f 70 5b 5d 20  ntries in aOp[] 
1370: 61 6e 64 20 61 41 72 67 5b 5d 20 2a 2f 0a 20 20  and aArg[] */.  
1380: 75 6e 73 69 67 6e 65 64 20 6e 41 6c 6c 6f 63 3b  unsigned nAlloc;
1390: 20 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20 53              /* S
13a0: 6c 6f 74 73 20 61 6c 6c 6f 63 61 74 65 64 20 66  lots allocated f
13b0: 6f 72 20 61 4f 70 5b 5d 20 61 6e 64 20 61 41 72  or aOp[] and aAr
13c0: 67 5b 5d 20 2a 2f 0a 7d 3b 0a 0a 2f 2a 20 41 64  g[] */.};../* Ad
13d0: 64 20 61 20 73 74 61 74 65 20 74 6f 20 74 68 65  d a state to the
13e0: 20 67 69 76 65 6e 20 73 74 61 74 65 20 73 65 74   given state set
13f0: 20 69 66 20 69 74 20 69 73 20 6e 6f 74 20 61 6c   if it is not al
1400: 72 65 61 64 79 20 74 68 65 72 65 20 2a 2f 0a 73  ready there */.s
1410: 74 61 74 69 63 20 76 6f 69 64 20 72 65 5f 61 64  tatic void re_ad
1420: 64 5f 73 74 61 74 65 28 52 65 53 74 61 74 65 53  d_state(ReStateS
1430: 65 74 20 2a 70 53 65 74 2c 20 69 6e 74 20 6e 65  et *pSet, int ne
1440: 77 53 74 61 74 65 29 7b 0a 20 20 75 6e 73 69 67  wState){.  unsig
1450: 6e 65 64 20 69 3b 0a 20 20 66 6f 72 28 69 3d 30  ned i;.  for(i=0
1460: 3b 20 69 3c 70 53 65 74 2d 3e 6e 53 74 61 74 65  ; i<pSet->nState
1470: 3b 20 69 2b 2b 29 20 69 66 28 20 70 53 65 74 2d  ; i++) if( pSet-
1480: 3e 61 53 74 61 74 65 5b 69 5d 3d 3d 6e 65 77 53  >aState[i]==newS
1490: 74 61 74 65 20 29 20 72 65 74 75 72 6e 3b 0a 20  tate ) return;. 
14a0: 20 70 53 65 74 2d 3e 61 53 74 61 74 65 5b 70 53   pSet->aState[pS
14b0: 65 74 2d 3e 6e 53 74 61 74 65 2b 2b 5d 20 3d 20  et->nState++] = 
14c0: 6e 65 77 53 74 61 74 65 3b 0a 7d 0a 0a 2f 2a 20  newState;.}../* 
14d0: 45 78 74 72 61 63 74 20 74 68 65 20 6e 65 78 74  Extract the next
14e0: 20 75 6e 69 63 6f 64 65 20 63 68 61 72 61 63 74   unicode charact
14f0: 65 72 20 66 72 6f 6d 20 2a 70 7a 49 6e 20 61 6e  er from *pzIn an
1500: 64 20 72 65 74 75 72 6e 20 69 74 2e 20 20 41 64  d return it.  Ad
1510: 76 61 6e 63 65 0a 2a 2a 20 2a 70 7a 49 6e 20 74  vance.** *pzIn t
1520: 6f 20 74 68 65 20 66 69 72 73 74 20 62 79 74 65  o the first byte
1530: 20 70 61 73 74 20 74 68 65 20 65 6e 64 20 6f 66   past the end of
1540: 20 74 68 65 20 63 68 61 72 61 63 74 65 72 20 72   the character r
1550: 65 74 75 72 6e 65 64 2e 20 20 54 6f 0a 2a 2a 20  eturned.  To.** 
1560: 62 65 20 63 6c 65 61 72 3a 20 20 74 68 69 73 20  be clear:  this 
1570: 72 6f 75 74 69 6e 65 20 63 6f 6e 76 65 72 74 73  routine converts
1580: 20 75 74 66 38 20 74 6f 20 75 6e 69 63 6f 64 65   utf8 to unicode
1590: 2e 20 20 54 68 69 73 20 72 6f 75 74 69 6e 65 20  .  This routine 
15a0: 69 73 20 0a 2a 2a 20 6f 70 74 69 6d 69 7a 65 64  is .** optimized
15b0: 20 66 6f 72 20 74 68 65 20 63 6f 6d 6d 6f 6e 20   for the common 
15c0: 63 61 73 65 20 77 68 65 72 65 20 74 68 65 20 6e  case where the n
15d0: 65 78 74 20 63 68 61 72 61 63 74 65 72 20 69 73  ext character is
15e0: 20 61 20 73 69 6e 67 6c 65 20 62 79 74 65 2e 0a   a single byte..
15f0: 2a 2f 0a 73 74 61 74 69 63 20 75 6e 73 69 67 6e  */.static unsign
1600: 65 64 20 72 65 5f 6e 65 78 74 5f 63 68 61 72 28  ed re_next_char(
1610: 52 65 49 6e 70 75 74 20 2a 70 29 7b 0a 20 20 75  ReInput *p){.  u
1620: 6e 73 69 67 6e 65 64 20 63 3b 0a 20 20 69 66 28  nsigned c;.  if(
1630: 20 70 2d 3e 69 3e 3d 70 2d 3e 6d 78 20 29 20 72   p->i>=p->mx ) r
1640: 65 74 75 72 6e 20 30 3b 0a 20 20 63 20 3d 20 70  eturn 0;.  c = p
1650: 2d 3e 7a 5b 70 2d 3e 69 2b 2b 5d 3b 0a 20 20 69  ->z[p->i++];.  i
1660: 66 28 20 63 3e 30 78 38 30 20 29 7b 0a 20 20 20  f( c>0x80 ){.   
1670: 20 69 66 28 20 28 63 26 30 78 65 30 29 3d 3d 30   if( (c&0xe0)==0
1680: 78 63 30 20 26 26 20 70 2d 3e 69 3c 70 2d 3e 6d  xc0 && p->i<p->m
1690: 78 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 5d  x && (p->z[p->i]
16a0: 26 30 78 63 30 29 3d 3d 30 78 38 30 20 29 7b 0a  &0xc0)==0x80 ){.
16b0: 20 20 20 20 20 20 63 20 3d 20 28 63 26 30 78 31        c = (c&0x1
16c0: 66 29 3c 3c 36 20 7c 20 28 70 2d 3e 7a 5b 70 2d  f)<<6 | (p->z[p-
16d0: 3e 69 2b 2b 5d 26 30 78 33 66 29 3b 0a 20 20 20  >i++]&0x3f);.   
16e0: 20 20 20 69 66 28 20 63 3c 30 78 38 30 20 29 20     if( c<0x80 ) 
16f0: 63 20 3d 20 30 78 66 66 66 64 3b 0a 20 20 20 20  c = 0xfffd;.    
1700: 7d 65 6c 73 65 20 69 66 28 20 28 63 26 30 78 66  }else if( (c&0xf
1710: 30 29 3d 3d 30 78 65 30 20 26 26 20 70 2d 3e 69  0)==0xe0 && p->i
1720: 2b 31 3c 70 2d 3e 6d 78 20 26 26 20 28 70 2d 3e  +1<p->mx && (p->
1730: 7a 5b 70 2d 3e 69 5d 26 30 78 63 30 29 3d 3d 30  z[p->i]&0xc0)==0
1740: 78 38 30 0a 20 20 20 20 20 20 20 20 20 20 20 26  x80.           &
1750: 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 31 5d 26  & (p->z[p->i+1]&
1760: 30 78 63 30 29 3d 3d 30 78 38 30 20 29 7b 0a 20  0xc0)==0x80 ){. 
1770: 20 20 20 20 20 63 20 3d 20 28 63 26 30 78 30 66       c = (c&0x0f
1780: 29 3c 3c 31 32 20 7c 20 28 28 70 2d 3e 7a 5b 70  )<<12 | ((p->z[p
1790: 2d 3e 69 5d 26 30 78 33 66 29 3c 3c 36 29 20 7c  ->i]&0x3f)<<6) |
17a0: 20 28 70 2d 3e 7a 5b 70 2d 3e 69 2b 31 5d 26 30   (p->z[p->i+1]&0
17b0: 78 33 66 29 3b 0a 20 20 20 20 20 20 70 2d 3e 69  x3f);.      p->i
17c0: 20 2b 3d 20 32 3b 0a 20 20 20 20 20 20 69 66 28   += 2;.      if(
17d0: 20 63 3c 30 78 33 66 66 20 7c 7c 20 28 63 3e 3d   c<0x3ff || (c>=
17e0: 30 78 64 38 30 30 20 26 26 20 63 3c 3d 30 78 64  0xd800 && c<=0xd
17f0: 66 66 66 29 20 29 20 63 20 3d 20 30 78 66 66 66  fff) ) c = 0xfff
1800: 64 3b 0a 20 20 20 20 7d 65 6c 73 65 20 69 66 28  d;.    }else if(
1810: 20 28 63 26 30 78 66 38 29 3d 3d 30 78 66 30 20   (c&0xf8)==0xf0 
1820: 26 26 20 70 2d 3e 69 2b 33 3c 70 2d 3e 6d 78 20  && p->i+3<p->mx 
1830: 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69 5d 26 30  && (p->z[p->i]&0
1840: 78 63 30 29 3d 3d 30 78 38 30 0a 20 20 20 20 20  xc0)==0x80.     
1850: 20 20 20 20 20 20 26 26 20 28 70 2d 3e 7a 5b 70        && (p->z[p
1860: 2d 3e 69 2b 31 5d 26 30 78 63 30 29 3d 3d 30 78  ->i+1]&0xc0)==0x
1870: 38 30 20 26 26 20 28 70 2d 3e 7a 5b 70 2d 3e 69  80 && (p->z[p->i
1880: 2b 32 5d 26 30 78 63 30 29 3d 3d 30 78 38 30 20  +2]&0xc0)==0x80 
1890: 29 7b 0a 20 20 20 20 20 20 63 20 3d 20 28 63 26  ){.      c = (c&
18a0: 30 78 30 37 29 3c 3c 31 38 20 7c 20 28 28 70 2d  0x07)<<18 | ((p-
18b0: 3e 7a 5b 70 2d 3e 69 5d 26 30 78 33 66 29 3c 3c  >z[p->i]&0x3f)<<
18c0: 31 32 29 20 7c 20 28 28 70 2d 3e 7a 5b 70 2d 3e  12) | ((p->z[p->
18d0: 69 2b 31 5d 26 30 78 33 66 29 3c 3c 36 29 0a 20  i+1]&0x3f)<<6). 
18e0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
18f0: 20 20 20 20 20 20 7c 20 28 70 2d 3e 7a 5b 70 2d        | (p->z[p-
1900: 3e 69 2b 32 5d 26 30 78 33 66 29 3b 0a 20 20 20  >i+2]&0x3f);.   
1910: 20 20 20 70 2d 3e 69 20 2b 3d 20 33 3b 0a 20 20     p->i += 3;.  
1920: 20 20 20 20 69 66 28 20 63 3c 30 78 66 66 66 66      if( c<0xffff
1930: 20 29 20 63 20 3d 20 30 78 66 66 66 64 3b 0a 20   ) c = 0xfffd;. 
1940: 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20     }else{.      
1950: 63 20 3d 20 30 78 66 66 66 64 3b 0a 20 20 20 20  c = 0xfffd;.    
1960: 7d 0a 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 63  }.  }.  return c
1970: 3b 0a 7d 0a 73 74 61 74 69 63 20 75 6e 73 69 67  ;.}.static unsig
1980: 6e 65 64 20 72 65 5f 6e 65 78 74 5f 63 68 61 72  ned re_next_char
1990: 5f 6e 6f 63 61 73 65 28 52 65 49 6e 70 75 74 20  _nocase(ReInput 
19a0: 2a 70 29 7b 0a 20 20 75 6e 73 69 67 6e 65 64 20  *p){.  unsigned 
19b0: 63 20 3d 20 72 65 5f 6e 65 78 74 5f 63 68 61 72  c = re_next_char
19c0: 28 70 29 3b 0a 20 20 69 66 28 20 63 3e 3d 27 41  (p);.  if( c>='A
19d0: 27 20 26 26 20 63 3c 3d 27 5a 27 20 29 20 63 20  ' && c<='Z' ) c 
19e0: 2b 3d 20 27 61 27 20 2d 20 27 41 27 3b 0a 20 20  += 'a' - 'A';.  
19f0: 72 65 74 75 72 6e 20 63 3b 0a 7d 0a 0a 2f 2a 20  return c;.}../* 
1a00: 52 65 74 75 72 6e 20 74 72 75 65 20 69 66 20 63  Return true if c
1a10: 20 69 73 20 61 20 70 65 72 6c 20 22 77 6f 72 64   is a perl "word
1a20: 22 20 63 68 61 72 61 63 74 65 72 3a 20 20 5b 41  " character:  [A
1a30: 2d 5a 61 2d 7a 30 2d 39 5f 5d 20 2a 2f 0a 73 74  -Za-z0-9_] */.st
1a40: 61 74 69 63 20 69 6e 74 20 72 65 5f 77 6f 72 64  atic int re_word
1a50: 5f 63 68 61 72 28 69 6e 74 20 63 29 7b 0a 20 20  _char(int c){.  
1a60: 72 65 74 75 72 6e 20 28 63 3e 3d 27 30 27 20 26  return (c>='0' &
1a70: 26 20 63 3c 3d 27 39 27 29 20 7c 7c 20 28 63 3e  & c<='9') || (c>
1a80: 3d 27 61 27 20 26 26 20 63 3c 3d 27 7a 27 29 0a  ='a' && c<='z').
1a90: 20 20 20 20 20 20 7c 7c 20 28 63 3e 3d 27 41 27        || (c>='A'
1aa0: 20 26 26 20 63 3c 3d 27 5a 27 29 20 7c 7c 20 63   && c<='Z') || c
1ab0: 3d 3d 27 5f 27 3b 0a 7d 0a 0a 2f 2a 20 52 65 74  =='_';.}../* Ret
1ac0: 75 72 6e 20 74 72 75 65 20 69 66 20 63 20 69 73  urn true if c is
1ad0: 20 61 20 22 64 69 67 69 74 22 20 63 68 61 72 61   a "digit" chara
1ae0: 63 74 65 72 3a 20 20 5b 30 2d 39 5d 20 2a 2f 0a  cter:  [0-9] */.
1af0: 73 74 61 74 69 63 20 69 6e 74 20 72 65 5f 64 69  static int re_di
1b00: 67 69 74 5f 63 68 61 72 28 69 6e 74 20 63 29 7b  git_char(int c){
1b10: 0a 20 20 72 65 74 75 72 6e 20 28 63 3e 3d 27 30  .  return (c>='0
1b20: 27 20 26 26 20 63 3c 3d 27 39 27 29 3b 0a 7d 0a  ' && c<='9');.}.
1b30: 0a 2f 2a 20 52 65 74 75 72 6e 20 74 72 75 65 20  ./* Return true 
1b40: 69 66 20 63 20 69 73 20 61 20 70 65 72 6c 20 22  if c is a perl "
1b50: 73 70 61 63 65 22 20 63 68 61 72 61 63 74 65 72  space" character
1b60: 3a 20 20 5b 20 5c 74 5c 72 5c 6e 5c 76 5c 66 5d  :  [ \t\r\n\v\f]
1b70: 20 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72   */.static int r
1b80: 65 5f 73 70 61 63 65 5f 63 68 61 72 28 69 6e 74  e_space_char(int
1b90: 20 63 29 7b 0a 20 20 72 65 74 75 72 6e 20 63 3d   c){.  return c=
1ba0: 3d 27 20 27 20 7c 7c 20 63 3d 3d 27 5c 74 27 20  =' ' || c=='\t' 
1bb0: 7c 7c 20 63 3d 3d 27 5c 6e 27 20 7c 7c 20 63 3d  || c=='\n' || c=
1bc0: 3d 27 5c 76 27 20 7c 7c 20 63 3d 3d 27 5c 66 27  ='\v' || c=='\f'
1bd0: 3b 0a 7d 0a 0a 2f 2a 20 52 75 6e 20 61 20 63 6f  ;.}../* Run a co
1be0: 6d 70 69 6c 65 64 20 72 65 67 75 6c 61 72 20 65  mpiled regular e
1bf0: 78 70 72 65 73 73 69 6f 6e 20 6f 6e 20 74 68 65  xpression on the
1c00: 20 7a 65 72 6f 2d 74 65 72 6d 69 6e 61 74 65 64   zero-terminated
1c10: 20 69 6e 70 75 74 0a 2a 2a 20 73 74 72 69 6e 67   input.** string
1c20: 20 7a 49 6e 5b 5d 2e 20 20 52 65 74 75 72 6e 20   zIn[].  Return 
1c30: 74 72 75 65 20 6f 6e 20 61 20 6d 61 74 63 68 20  true on a match 
1c40: 61 6e 64 20 66 61 6c 73 65 20 69 66 20 74 68 65  and false if the
1c50: 72 65 20 69 73 20 6e 6f 20 6d 61 74 63 68 2e 0a  re is no match..
1c60: 2a 2f 0a 69 6e 74 20 72 65 5f 6d 61 74 63 68 28  */.int re_match(
1c70: 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 52 65 2c  ReCompiled *pRe,
1c80: 20 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20   const unsigned 
1c90: 63 68 61 72 20 2a 7a 49 6e 2c 20 69 6e 74 20 6e  char *zIn, int n
1ca0: 49 6e 29 7b 0a 20 20 52 65 53 74 61 74 65 53 65  In){.  ReStateSe
1cb0: 74 20 61 53 74 61 74 65 53 65 74 5b 32 5d 2c 20  t aStateSet[2], 
1cc0: 2a 70 54 68 69 73 2c 20 2a 70 4e 65 78 74 3b 0a  *pThis, *pNext;.
1cd0: 20 20 52 65 53 74 61 74 65 4e 75 6d 62 65 72 20    ReStateNumber 
1ce0: 61 53 70 61 63 65 5b 31 30 30 5d 3b 0a 20 20 52  aSpace[100];.  R
1cf0: 65 53 74 61 74 65 4e 75 6d 62 65 72 20 2a 70 54  eStateNumber *pT
1d00: 6f 46 72 65 65 3b 0a 20 20 75 6e 73 69 67 6e 65  oFree;.  unsigne
1d10: 64 20 69 6e 74 20 69 20 3d 20 30 3b 0a 20 20 75  d int i = 0;.  u
1d20: 6e 73 69 67 6e 65 64 20 69 6e 74 20 69 53 77 61  nsigned int iSwa
1d30: 70 20 3d 20 30 3b 0a 20 20 69 6e 74 20 63 20 3d  p = 0;.  int c =
1d40: 20 52 45 5f 45 4f 46 2b 31 3b 0a 20 20 69 6e 74   RE_EOF+1;.  int
1d50: 20 63 50 72 65 76 20 3d 20 30 3b 0a 20 20 69 6e   cPrev = 0;.  in
1d60: 74 20 72 63 20 3d 20 30 3b 0a 20 20 52 65 49 6e  t rc = 0;.  ReIn
1d70: 70 75 74 20 69 6e 3b 0a 0a 20 20 69 6e 2e 7a 20  put in;..  in.z 
1d80: 3d 20 7a 49 6e 3b 0a 20 20 69 6e 2e 69 20 3d 20  = zIn;.  in.i = 
1d90: 30 3b 0a 20 20 69 6e 2e 6d 78 20 3d 20 6e 49 6e  0;.  in.mx = nIn
1da0: 3e 3d 30 20 3f 20 6e 49 6e 20 3a 20 73 74 72 6c  >=0 ? nIn : strl
1db0: 65 6e 28 28 63 68 61 72 2a 29 7a 49 6e 29 3b 0a  en((char*)zIn);.
1dc0: 20 20 69 66 28 20 70 52 65 2d 3e 6e 49 6e 69 74    if( pRe->nInit
1dd0: 20 29 7b 0a 20 20 20 20 75 6e 73 69 67 6e 65 64   ){.    unsigned
1de0: 20 63 68 61 72 20 78 20 3d 20 70 52 65 2d 3e 7a   char x = pRe->z
1df0: 49 6e 69 74 5b 30 5d 3b 0a 20 20 20 20 77 68 69  Init[0];.    whi
1e00: 6c 65 28 20 69 6e 2e 69 2b 70 52 65 2d 3e 6e 49  le( in.i+pRe->nI
1e10: 6e 69 74 3c 3d 69 6e 2e 6d 78 20 0a 20 20 20 20  nit<=in.mx .    
1e20: 20 20 20 20 26 26 20 28 7a 49 6e 5b 69 6e 2e 69      && (zIn[in.i
1e30: 5d 21 3d 78 20 7c 7c 20 6d 65 6d 63 6d 70 28 7a  ]!=x || memcmp(z
1e40: 49 6e 2b 69 6e 2e 69 2c 20 70 52 65 2d 3e 7a 49  In+in.i, pRe->zI
1e50: 6e 69 74 2c 20 70 52 65 2d 3e 6e 49 6e 69 74 29  nit, pRe->nInit)
1e60: 21 3d 30 29 0a 20 20 20 20 29 7b 0a 20 20 20 20  !=0).    ){.    
1e70: 20 20 69 6e 2e 69 2b 2b 3b 0a 20 20 20 20 7d 0a    in.i++;.    }.
1e80: 20 20 20 20 69 66 28 20 69 6e 2e 69 2b 70 52 65      if( in.i+pRe
1e90: 2d 3e 6e 49 6e 69 74 3e 69 6e 2e 6d 78 20 29 20  ->nInit>in.mx ) 
1ea0: 72 65 74 75 72 6e 20 30 3b 0a 20 20 7d 0a 20 20  return 0;.  }.  
1eb0: 69 66 28 20 70 52 65 2d 3e 6e 53 74 61 74 65 3c  if( pRe->nState<
1ec0: 3d 28 73 69 7a 65 6f 66 28 61 53 70 61 63 65 29  =(sizeof(aSpace)
1ed0: 2f 28 73 69 7a 65 6f 66 28 61 53 70 61 63 65 5b  /(sizeof(aSpace[
1ee0: 30 5d 29 2a 32 29 29 20 29 7b 0a 20 20 20 20 70  0])*2)) ){.    p
1ef0: 54 6f 46 72 65 65 20 3d 20 30 3b 0a 20 20 20 20  ToFree = 0;.    
1f00: 61 53 74 61 74 65 53 65 74 5b 30 5d 2e 61 53 74  aStateSet[0].aSt
1f10: 61 74 65 20 3d 20 61 53 70 61 63 65 3b 0a 20 20  ate = aSpace;.  
1f20: 7d 65 6c 73 65 7b 0a 20 20 20 20 70 54 6f 46 72  }else{.    pToFr
1f30: 65 65 20 3d 20 73 71 6c 69 74 65 33 5f 6d 61 6c  ee = sqlite3_mal
1f40: 6c 6f 63 28 20 73 69 7a 65 6f 66 28 52 65 53 74  loc( sizeof(ReSt
1f50: 61 74 65 4e 75 6d 62 65 72 29 2a 32 2a 70 52 65  ateNumber)*2*pRe
1f60: 2d 3e 6e 53 74 61 74 65 20 29 3b 0a 20 20 20 20  ->nState );.    
1f70: 69 66 28 20 70 54 6f 46 72 65 65 3d 3d 30 20 29  if( pToFree==0 )
1f80: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20   return -1;.    
1f90: 61 53 74 61 74 65 53 65 74 5b 30 5d 2e 61 53 74  aStateSet[0].aSt
1fa0: 61 74 65 20 3d 20 70 54 6f 46 72 65 65 3b 0a 20  ate = pToFree;. 
1fb0: 20 7d 0a 20 20 61 53 74 61 74 65 53 65 74 5b 31   }.  aStateSet[1
1fc0: 5d 2e 61 53 74 61 74 65 20 3d 20 26 61 53 74 61  ].aState = &aSta
1fd0: 74 65 53 65 74 5b 30 5d 2e 61 53 74 61 74 65 5b  teSet[0].aState[
1fe0: 70 52 65 2d 3e 6e 53 74 61 74 65 5d 3b 0a 20 20  pRe->nState];.  
1ff0: 70 4e 65 78 74 20 3d 20 26 61 53 74 61 74 65 53  pNext = &aStateS
2000: 65 74 5b 31 5d 3b 0a 20 20 70 4e 65 78 74 2d 3e  et[1];.  pNext->
2010: 6e 53 74 61 74 65 20 3d 20 30 3b 0a 20 20 72 65  nState = 0;.  re
2020: 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74  _add_state(pNext
2030: 2c 20 30 29 3b 0a 20 20 77 68 69 6c 65 28 20 63  , 0);.  while( c
2040: 21 3d 52 45 5f 45 4f 46 20 26 26 20 70 4e 65 78  !=RE_EOF && pNex
2050: 74 2d 3e 6e 53 74 61 74 65 3e 30 20 29 7b 0a 20  t->nState>0 ){. 
2060: 20 20 20 63 50 72 65 76 20 3d 20 63 3b 0a 20 20     cPrev = c;.  
2070: 20 20 63 20 3d 20 70 52 65 2d 3e 78 4e 65 78 74    c = pRe->xNext
2080: 43 68 61 72 28 26 69 6e 29 3b 0a 20 20 20 20 70  Char(&in);.    p
2090: 54 68 69 73 20 3d 20 70 4e 65 78 74 3b 0a 20 20  This = pNext;.  
20a0: 20 20 70 4e 65 78 74 20 3d 20 26 61 53 74 61 74    pNext = &aStat
20b0: 65 53 65 74 5b 69 53 77 61 70 5d 3b 0a 20 20 20  eSet[iSwap];.   
20c0: 20 69 53 77 61 70 20 3d 20 31 20 2d 20 69 53 77   iSwap = 1 - iSw
20d0: 61 70 3b 0a 20 20 20 20 70 4e 65 78 74 2d 3e 6e  ap;.    pNext->n
20e0: 53 74 61 74 65 20 3d 20 30 3b 0a 20 20 20 20 66  State = 0;.    f
20f0: 6f 72 28 69 3d 30 3b 20 69 3c 70 54 68 69 73 2d  or(i=0; i<pThis-
2100: 3e 6e 53 74 61 74 65 3b 20 69 2b 2b 29 7b 0a 20  >nState; i++){. 
2110: 20 20 20 20 20 69 6e 74 20 78 20 3d 20 70 54 68       int x = pTh
2120: 69 73 2d 3e 61 53 74 61 74 65 5b 69 5d 3b 0a 20  is->aState[i];. 
2130: 20 20 20 20 20 73 77 69 74 63 68 28 20 70 52 65       switch( pRe
2140: 2d 3e 61 4f 70 5b 78 5d 20 29 7b 0a 20 20 20 20  ->aOp[x] ){.    
2150: 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4d      case RE_OP_M
2160: 41 54 43 48 3a 20 7b 0a 20 20 20 20 20 20 20 20  ATCH: {.        
2170: 20 20 69 66 28 20 70 52 65 2d 3e 61 41 72 67 5b    if( pRe->aArg[
2180: 78 5d 3d 3d 63 20 29 20 72 65 5f 61 64 64 5f 73  x]==c ) re_add_s
2190: 74 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29  tate(pNext, x+1)
21a0: 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61  ;.          brea
21b0: 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20  k;.        }.   
21c0: 20 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f       case RE_OP_
21d0: 41 4e 59 3a 20 7b 0a 20 20 20 20 20 20 20 20 20  ANY: {.         
21e0: 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e   re_add_state(pN
21f0: 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20  ext, x+1);.     
2200: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
2210: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61      }.        ca
2220: 73 65 20 52 45 5f 4f 50 5f 57 4f 52 44 3a 20 7b  se RE_OP_WORD: {
2230: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 72  .          if( r
2240: 65 5f 77 6f 72 64 5f 63 68 61 72 28 63 29 20 29  e_word_char(c) )
2250: 20 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e   re_add_state(pN
2260: 65 78 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20  ext, x+1);.     
2270: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
2280: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61      }.        ca
2290: 73 65 20 52 45 5f 4f 50 5f 4e 4f 54 57 4f 52 44  se RE_OP_NOTWORD
22a0: 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66  : {.          if
22b0: 28 20 21 72 65 5f 77 6f 72 64 5f 63 68 61 72 28  ( !re_word_char(
22c0: 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74  c) ) re_add_stat
22d0: 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20  e(pNext, x+1);. 
22e0: 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a           break;.
22f0: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
2300: 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 44 49 47    case RE_OP_DIG
2310: 49 54 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20  IT: {.          
2320: 69 66 28 20 72 65 5f 64 69 67 69 74 5f 63 68 61  if( re_digit_cha
2330: 72 28 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74  r(c) ) re_add_st
2340: 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b  ate(pNext, x+1);
2350: 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b  .          break
2360: 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20  ;.        }.    
2370: 20 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 4e      case RE_OP_N
2380: 4f 54 44 49 47 49 54 3a 20 7b 0a 20 20 20 20 20  OTDIGIT: {.     
2390: 20 20 20 20 20 69 66 28 20 21 72 65 5f 64 69 67       if( !re_dig
23a0: 69 74 5f 63 68 61 72 28 63 29 20 29 20 72 65 5f  it_char(c) ) re_
23b0: 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c  add_state(pNext,
23c0: 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20   x+1);.         
23d0: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20   break;.        
23e0: 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52  }.        case R
23f0: 45 5f 4f 50 5f 53 50 41 43 45 3a 20 7b 0a 20 20  E_OP_SPACE: {.  
2400: 20 20 20 20 20 20 20 20 69 66 28 20 72 65 5f 73          if( re_s
2410: 70 61 63 65 5f 63 68 61 72 28 63 29 20 29 20 72  pace_char(c) ) r
2420: 65 5f 61 64 64 5f 73 74 61 74 65 28 70 4e 65 78  e_add_state(pNex
2430: 74 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20  t, x+1);.       
2440: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20     break;.      
2450: 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65    }.        case
2460: 20 52 45 5f 4f 50 5f 4e 4f 54 53 50 41 43 45 3a   RE_OP_NOTSPACE:
2470: 20 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28   {.          if(
2480: 20 21 72 65 5f 73 70 61 63 65 5f 63 68 61 72 28   !re_space_char(
2490: 63 29 20 29 20 72 65 5f 61 64 64 5f 73 74 61 74  c) ) re_add_stat
24a0: 65 28 70 4e 65 78 74 2c 20 78 2b 31 29 3b 0a 20  e(pNext, x+1);. 
24b0: 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a           break;.
24c0: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
24d0: 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 42 4f 55    case RE_OP_BOU
24e0: 4e 44 41 52 59 3a 20 7b 0a 20 20 20 20 20 20 20  NDARY: {.       
24f0: 20 20 20 69 66 28 20 72 65 5f 77 6f 72 64 5f 63     if( re_word_c
2500: 68 61 72 28 63 29 21 3d 72 65 5f 77 6f 72 64 5f  har(c)!=re_word_
2510: 63 68 61 72 28 63 50 72 65 76 29 20 29 20 72 65  char(cPrev) ) re
2520: 5f 61 64 64 5f 73 74 61 74 65 28 70 54 68 69 73  _add_state(pThis
2530: 2c 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20  , x+1);.        
2540: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20    break;.       
2550: 20 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20   }.        case 
2560: 52 45 5f 4f 50 5f 41 4e 59 53 54 41 52 3a 20 7b  RE_OP_ANYSTAR: {
2570: 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 64  .          re_ad
2580: 64 5f 73 74 61 74 65 28 70 4e 65 78 74 2c 20 78  d_state(pNext, x
2590: 29 3b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f  );.          re_
25a0: 61 64 64 5f 73 74 61 74 65 28 70 54 68 69 73 2c  add_state(pThis,
25b0: 20 78 2b 31 29 3b 0a 20 20 20 20 20 20 20 20 20   x+1);.         
25c0: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20   break;.        
25d0: 7d 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52  }.        case R
25e0: 45 5f 4f 50 5f 46 4f 52 4b 3a 20 7b 0a 20 20 20  E_OP_FORK: {.   
25f0: 20 20 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74         re_add_st
2600: 61 74 65 28 70 54 68 69 73 2c 20 78 2b 70 52 65  ate(pThis, x+pRe
2610: 2d 3e 61 41 72 67 5b 78 5d 29 3b 0a 20 20 20 20  ->aArg[x]);.    
2620: 20 20 20 20 20 20 72 65 5f 61 64 64 5f 73 74 61        re_add_sta
2630: 74 65 28 70 54 68 69 73 2c 20 78 2b 31 29 3b 0a  te(pThis, x+1);.
2640: 20 20 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b            break;
2650: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20  .        }.     
2660: 20 20 20 63 61 73 65 20 52 45 5f 4f 50 5f 47 4f     case RE_OP_GO
2670: 54 4f 3a 20 7b 0a 20 20 20 20 20 20 20 20 20 20  TO: {.          
2680: 72 65 5f 61 64 64 5f 73 74 61 74 65 28 70 54 68  re_add_state(pTh
2690: 69 73 2c 20 78 2b 70 52 65 2d 3e 61 41 72 67 5b  is, x+pRe->aArg[
26a0: 78 5d 29 3b 0a 20 20 20 20 20 20 20 20 20 20 62  x]);.          b
26b0: 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a  reak;.        }.
26c0: 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45 5f          case RE_
26d0: 4f 50 5f 41 43 43 45 50 54 3a 20 7b 0a 20 20 20  OP_ACCEPT: {.   
26e0: 20 20 20 20 20 20 20 72 63 20 3d 20 31 3b 0a 20         rc = 1;. 
26f0: 20 20 20 20 20 20 20 20 20 67 6f 74 6f 20 72 65           goto re
2700: 5f 6d 61 74 63 68 5f 65 6e 64 3b 0a 20 20 20 20  _match_end;.    
2710: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 63 61      }.        ca
2720: 73 65 20 52 45 5f 4f 50 5f 43 43 5f 49 4e 43 3a  se RE_OP_CC_INC:
2730: 0a 20 20 20 20 20 20 20 20 63 61 73 65 20 52 45  .        case RE
2740: 5f 4f 50 5f 43 43 5f 45 58 43 3a 20 7b 0a 20 20  _OP_CC_EXC: {.  
2750: 20 20 20 20 20 20 20 20 69 6e 74 20 6a 20 3d 20          int j = 
2760: 31 3b 0a 20 20 20 20 20 20 20 20 20 20 69 6e 74  1;.          int
2770: 20 6e 20 3d 20 70 52 65 2d 3e 61 41 72 67 5b 78   n = pRe->aArg[x
2780: 5d 3b 0a 20 20 20 20 20 20 20 20 20 20 69 6e 74  ];.          int
2790: 20 68 69 74 20 3d 20 30 3b 0a 20 20 20 20 20 20   hit = 0;.      
27a0: 20 20 20 20 66 6f 72 28 6a 3d 31 3b 20 6a 3e 30      for(j=1; j>0
27b0: 20 26 26 20 6a 3c 6e 3b 20 6a 2b 2b 29 7b 0a 20   && j<n; j++){. 
27c0: 20 20 20 20 20 20 20 20 20 20 20 69 66 28 20 70             if( p
27d0: 52 65 2d 3e 61 4f 70 5b 78 2b 6a 5d 3d 3d 52 45  Re->aOp[x+j]==RE
27e0: 5f 4f 50 5f 43 43 5f 56 41 4c 55 45 20 29 7b 0a  _OP_CC_VALUE ){.
27f0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 69 66                if
2800: 28 20 70 52 65 2d 3e 61 41 72 67 5b 78 2b 6a 5d  ( pRe->aArg[x+j]
2810: 3d 3d 63 20 29 7b 0a 20 20 20 20 20 20 20 20 20  ==c ){.         
2820: 20 20 20 20 20 20 20 68 69 74 20 3d 20 31 3b 0a         hit = 1;.
2830: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2840: 6a 20 3d 20 2d 31 3b 0a 20 20 20 20 20 20 20 20  j = -1;.        
2850: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
2860: 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20      }else{.     
2870: 20 20 20 20 20 20 20 20 20 69 66 28 20 70 52 65           if( pRe
2880: 2d 3e 61 41 72 67 5b 78 2b 6a 5d 3c 3d 63 20 26  ->aArg[x+j]<=c &
2890: 26 20 70 52 65 2d 3e 61 41 72 67 5b 78 2b 6a 2b  & pRe->aArg[x+j+
28a0: 31 5d 3e 3d 63 20 29 7b 0a 20 20 20 20 20 20 20  1]>=c ){.       
28b0: 20 20 20 20 20 20 20 20 20 68 69 74 20 3d 20 31           hit = 1
28c0: 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ;.              
28d0: 20 20 6a 20 3d 20 2d 31 3b 0a 20 20 20 20 20 20    j = -1;.      
28e0: 20 20 20 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20          }else{. 
28f0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 6a                 j
2900: 2b 2b 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20  ++;.            
2910: 20 20 7d 0a 20 20 20 20 20 20 20 20 20 20 20 20    }.            
2920: 7d 0a 20 20 20 20 20 20 20 20 20 20 7d 0a 20 20  }.          }.  
2930: 20 20 20 20 20 20 20 20 69 66 28 20 70 52 65 2d          if( pRe-
2940: 3e 61 4f 70 5b 78 5d 3d 3d 52 45 5f 4f 50 5f 43  >aOp[x]==RE_OP_C
2950: 43 5f 45 58 43 20 29 20 68 69 74 20 3d 20 21 68  C_EXC ) hit = !h
2960: 69 74 3b 0a 20 20 20 20 20 20 20 20 20 20 69 66  it;.          if
2970: 28 20 68 69 74 20 29 20 72 65 5f 61 64 64 5f 73  ( hit ) re_add_s
2980: 74 61 74 65 28 70 4e 65 78 74 2c 20 78 2b 6e 29  tate(pNext, x+n)
2990: 3b 0a 20 20 20 20 20 20 20 20 20 20 62 72 65 61  ;.          brea
29a0: 6b 3b 20 20 20 20 20 20 20 20 20 20 20 20 0a 20  k;            . 
29b0: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 7d         }.      }
29c0: 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20 66 6f 72  .    }.  }.  for
29d0: 28 69 3d 30 3b 20 69 3c 70 4e 65 78 74 2d 3e 6e  (i=0; i<pNext->n
29e0: 53 74 61 74 65 3b 20 69 2b 2b 29 7b 0a 20 20 20  State; i++){.   
29f0: 20 69 66 28 20 70 52 65 2d 3e 61 4f 70 5b 70 4e   if( pRe->aOp[pN
2a00: 65 78 74 2d 3e 61 53 74 61 74 65 5b 69 5d 5d 3d  ext->aState[i]]=
2a10: 3d 52 45 5f 4f 50 5f 41 43 43 45 50 54 20 29 7b  =RE_OP_ACCEPT ){
2a20: 20 72 63 20 3d 20 31 3b 20 62 72 65 61 6b 3b 20   rc = 1; break; 
2a30: 7d 0a 20 20 7d 0a 72 65 5f 6d 61 74 63 68 5f 65  }.  }.re_match_e
2a40: 6e 64 3a 0a 20 20 73 71 6c 69 74 65 33 5f 66 72  nd:.  sqlite3_fr
2a50: 65 65 28 70 54 6f 46 72 65 65 29 3b 0a 20 20 72  ee(pToFree);.  r
2a60: 65 74 75 72 6e 20 72 63 3b 0a 7d 0a 0a 2f 2a 20  eturn rc;.}../* 
2a70: 52 65 73 69 7a 65 20 74 68 65 20 6f 70 63 6f 64  Resize the opcod
2a80: 65 20 61 6e 64 20 61 72 67 75 6d 65 6e 74 20 61  e and argument a
2a90: 72 72 61 79 73 20 66 6f 72 20 61 6e 20 52 45 20  rrays for an RE 
2aa0: 75 6e 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69  under constructi
2ab0: 6f 6e 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e  on..*/.static in
2ac0: 74 20 72 65 5f 72 65 73 69 7a 65 28 52 65 43 6f  t re_resize(ReCo
2ad0: 6d 70 69 6c 65 64 20 2a 70 2c 20 69 6e 74 20 4e  mpiled *p, int N
2ae0: 29 7b 0a 20 20 63 68 61 72 20 2a 61 4f 70 3b 0a  ){.  char *aOp;.
2af0: 20 20 69 6e 74 20 2a 61 41 72 67 3b 0a 20 20 61    int *aArg;.  a
2b00: 4f 70 20 3d 20 73 71 6c 69 74 65 33 5f 72 65 61  Op = sqlite3_rea
2b10: 6c 6c 6f 63 28 70 2d 3e 61 4f 70 2c 20 4e 2a 73  lloc(p->aOp, N*s
2b20: 69 7a 65 6f 66 28 70 2d 3e 61 4f 70 5b 30 5d 29  izeof(p->aOp[0])
2b30: 29 3b 0a 20 20 69 66 28 20 61 4f 70 3d 3d 30 20  );.  if( aOp==0 
2b40: 29 20 72 65 74 75 72 6e 20 31 3b 0a 20 20 70 2d  ) return 1;.  p-
2b50: 3e 61 4f 70 20 3d 20 61 4f 70 3b 0a 20 20 61 41  >aOp = aOp;.  aA
2b60: 72 67 20 3d 20 73 71 6c 69 74 65 33 5f 72 65 61  rg = sqlite3_rea
2b70: 6c 6c 6f 63 28 70 2d 3e 61 41 72 67 2c 20 4e 2a  lloc(p->aArg, N*
2b80: 73 69 7a 65 6f 66 28 70 2d 3e 61 41 72 67 5b 30  sizeof(p->aArg[0
2b90: 5d 29 29 3b 0a 20 20 69 66 28 20 61 41 72 67 3d  ]));.  if( aArg=
2ba0: 3d 30 20 29 20 72 65 74 75 72 6e 20 31 3b 0a 20  =0 ) return 1;. 
2bb0: 20 70 2d 3e 61 41 72 67 20 3d 20 61 41 72 67 3b   p->aArg = aArg;
2bc0: 0a 20 20 70 2d 3e 6e 41 6c 6c 6f 63 20 3d 20 4e  .  p->nAlloc = N
2bd0: 3b 0a 20 20 72 65 74 75 72 6e 20 30 3b 0a 7d 0a  ;.  return 0;.}.
2be0: 0a 2f 2a 20 49 6e 73 65 72 74 20 61 20 6e 65 77  ./* Insert a new
2bf0: 20 6f 70 63 6f 64 65 20 61 6e 64 20 61 72 67 75   opcode and argu
2c00: 6d 65 6e 74 20 69 6e 74 6f 20 61 6e 20 52 45 20  ment into an RE 
2c10: 75 6e 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69  under constructi
2c20: 6f 6e 2e 20 20 54 68 65 0a 2a 2a 20 69 6e 73 65  on.  The.** inse
2c30: 72 74 69 6f 6e 20 70 6f 69 6e 74 20 69 73 20 6a  rtion point is j
2c40: 75 73 74 20 70 72 69 6f 72 20 74 6f 20 65 78 69  ust prior to exi
2c50: 73 74 69 6e 67 20 6f 70 63 6f 64 65 20 69 42 65  sting opcode iBe
2c60: 66 6f 72 65 2e 0a 2a 2f 0a 73 74 61 74 69 63 20  fore..*/.static 
2c70: 69 6e 74 20 72 65 5f 69 6e 73 65 72 74 28 52 65  int re_insert(Re
2c80: 43 6f 6d 70 69 6c 65 64 20 2a 70 2c 20 69 6e 74  Compiled *p, int
2c90: 20 69 42 65 66 6f 72 65 2c 20 69 6e 74 20 6f 70   iBefore, int op
2ca0: 2c 20 69 6e 74 20 61 72 67 29 7b 0a 20 20 69 6e  , int arg){.  in
2cb0: 74 20 69 3b 0a 20 20 69 66 28 20 70 2d 3e 6e 41  t i;.  if( p->nA
2cc0: 6c 6c 6f 63 3c 3d 70 2d 3e 6e 53 74 61 74 65 20  lloc<=p->nState 
2cd0: 26 26 20 72 65 5f 72 65 73 69 7a 65 28 70 2c 20  && re_resize(p, 
2ce0: 70 2d 3e 6e 41 6c 6c 6f 63 2a 32 29 20 29 20 72  p->nAlloc*2) ) r
2cf0: 65 74 75 72 6e 20 30 3b 0a 20 20 66 6f 72 28 69  eturn 0;.  for(i
2d00: 3d 70 2d 3e 6e 53 74 61 74 65 3b 20 69 3e 69 42  =p->nState; i>iB
2d10: 65 66 6f 72 65 3b 20 69 2d 2d 29 7b 0a 20 20 20  efore; i--){.   
2d20: 20 70 2d 3e 61 4f 70 5b 69 5d 20 3d 20 70 2d 3e   p->aOp[i] = p->
2d30: 61 4f 70 5b 69 2d 31 5d 3b 0a 20 20 20 20 70 2d  aOp[i-1];.    p-
2d40: 3e 61 41 72 67 5b 69 5d 20 3d 20 70 2d 3e 61 41  >aArg[i] = p->aA
2d50: 72 67 5b 69 2d 31 5d 3b 0a 20 20 7d 0a 20 20 70  rg[i-1];.  }.  p
2d60: 2d 3e 6e 53 74 61 74 65 2b 2b 3b 0a 20 20 70 2d  ->nState++;.  p-
2d70: 3e 61 4f 70 5b 69 42 65 66 6f 72 65 5d 20 3d 20  >aOp[iBefore] = 
2d80: 6f 70 3b 0a 20 20 70 2d 3e 61 41 72 67 5b 69 42  op;.  p->aArg[iB
2d90: 65 66 6f 72 65 5d 20 3d 20 61 72 67 3b 0a 20 20  efore] = arg;.  
2da0: 72 65 74 75 72 6e 20 69 42 65 66 6f 72 65 3b 0a  return iBefore;.
2db0: 7d 0a 0a 2f 2a 20 41 70 70 65 6e 64 20 61 20 6e  }../* Append a n
2dc0: 65 77 20 6f 70 63 6f 64 65 20 61 6e 64 20 61 72  ew opcode and ar
2dd0: 67 75 6d 65 6e 74 20 74 6f 20 74 68 65 20 65 6e  gument to the en
2de0: 64 20 6f 66 20 74 68 65 20 52 45 20 75 6e 64 65  d of the RE unde
2df0: 72 20 63 6f 6e 73 74 72 75 63 74 69 6f 6e 2e 0a  r construction..
2e00: 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74 20 72 65  */.static int re
2e10: 5f 61 70 70 65 6e 64 28 52 65 43 6f 6d 70 69 6c  _append(ReCompil
2e20: 65 64 20 2a 70 2c 20 69 6e 74 20 6f 70 2c 20 69  ed *p, int op, i
2e30: 6e 74 20 61 72 67 29 7b 0a 20 20 72 65 74 75 72  nt arg){.  retur
2e40: 6e 20 72 65 5f 69 6e 73 65 72 74 28 70 2c 20 70  n re_insert(p, p
2e50: 2d 3e 6e 53 74 61 74 65 2c 20 6f 70 2c 20 61 72  ->nState, op, ar
2e60: 67 29 3b 0a 7d 0a 0a 2f 2a 20 4d 61 6b 65 20 61  g);.}../* Make a
2e70: 20 63 6f 70 79 20 6f 66 20 4e 20 6f 70 63 6f 64   copy of N opcod
2e80: 65 73 20 73 74 61 72 74 69 6e 67 20 61 74 20 69  es starting at i
2e90: 53 74 61 72 74 20 6f 6e 74 6f 20 74 68 65 20 65  Start onto the e
2ea0: 6e 64 20 6f 66 20 74 68 65 20 52 45 0a 2a 2a 20  nd of the RE.** 
2eb0: 75 6e 64 65 72 20 63 6f 6e 73 74 72 75 63 74 69  under constructi
2ec0: 6f 6e 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 76 6f  on..*/.static vo
2ed0: 69 64 20 72 65 5f 63 6f 70 79 28 52 65 43 6f 6d  id re_copy(ReCom
2ee0: 70 69 6c 65 64 20 2a 70 2c 20 69 6e 74 20 69 53  piled *p, int iS
2ef0: 74 61 72 74 2c 20 69 6e 74 20 4e 29 7b 0a 20 20  tart, int N){.  
2f00: 69 66 28 20 70 2d 3e 6e 53 74 61 74 65 2b 4e 3e  if( p->nState+N>
2f10: 3d 70 2d 3e 6e 41 6c 6c 6f 63 20 26 26 20 72 65  =p->nAlloc && re
2f20: 5f 72 65 73 69 7a 65 28 70 2c 20 70 2d 3e 6e 41  _resize(p, p->nA
2f30: 6c 6c 6f 63 2a 32 2b 4e 29 20 29 20 72 65 74 75  lloc*2+N) ) retu
2f40: 72 6e 3b 0a 20 20 6d 65 6d 63 70 79 28 26 70 2d  rn;.  memcpy(&p-
2f50: 3e 61 4f 70 5b 70 2d 3e 6e 53 74 61 74 65 5d 2c  >aOp[p->nState],
2f60: 20 26 70 2d 3e 61 4f 70 5b 69 53 74 61 72 74 5d   &p->aOp[iStart]
2f70: 2c 20 4e 2a 73 69 7a 65 6f 66 28 70 2d 3e 61 4f  , N*sizeof(p->aO
2f80: 70 5b 30 5d 29 29 3b 0a 20 20 6d 65 6d 63 70 79  p[0]));.  memcpy
2f90: 28 26 70 2d 3e 61 41 72 67 5b 70 2d 3e 6e 53 74  (&p->aArg[p->nSt
2fa0: 61 74 65 5d 2c 20 26 70 2d 3e 61 41 72 67 5b 69  ate], &p->aArg[i
2fb0: 53 74 61 72 74 5d 2c 20 4e 2a 73 69 7a 65 6f 66  Start], N*sizeof
2fc0: 28 70 2d 3e 61 41 72 67 5b 30 5d 29 29 3b 0a 20  (p->aArg[0]));. 
2fd0: 20 70 2d 3e 6e 53 74 61 74 65 20 2b 3d 20 4e 3b   p->nState += N;
2fe0: 0a 7d 0a 0a 2f 2a 20 52 65 74 75 72 6e 20 74 72  .}../* Return tr
2ff0: 75 65 20 69 66 20 63 20 69 73 20 61 20 68 65 78  ue if c is a hex
3000: 61 64 65 63 69 6d 61 6c 20 64 69 67 69 74 20 63  adecimal digit c
3010: 68 61 72 61 63 74 65 72 3a 20 20 5b 30 2d 39 61  haracter:  [0-9a
3020: 2d 66 41 2d 46 5d 0a 2a 2a 20 49 66 20 63 20 69  -fA-F].** If c i
3030: 73 20 61 20 68 65 78 20 64 69 67 69 74 2c 20 61  s a hex digit, a
3040: 6c 73 6f 20 73 65 74 20 2a 70 56 20 3d 20 28 2a  lso set *pV = (*
3050: 70 56 29 2a 31 36 20 2b 20 76 61 6c 75 65 6f 66  pV)*16 + valueof
3060: 28 63 29 2e 20 20 49 66 0a 2a 2a 20 63 20 69 73  (c).  If.** c is
3070: 20 6e 6f 74 20 61 20 68 65 78 20 64 69 67 69 74   not a hex digit
3080: 20 2a 70 56 20 69 73 20 75 6e 63 68 61 6e 67 65   *pV is unchange
3090: 64 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 69 6e 74  d..*/.static int
30a0: 20 72 65 5f 68 65 78 28 69 6e 74 20 63 2c 20 69   re_hex(int c, i
30b0: 6e 74 20 2a 70 56 29 7b 0a 20 20 69 66 28 20 63  nt *pV){.  if( c
30c0: 3e 3d 27 30 27 20 26 26 20 63 3c 3d 27 39 27 20  >='0' && c<='9' 
30d0: 29 7b 0a 20 20 20 20 63 20 2d 3d 20 27 30 27 3b  ){.    c -= '0';
30e0: 0a 20 20 7d 65 6c 73 65 20 69 66 28 20 63 3e 3d  .  }else if( c>=
30f0: 27 61 27 20 26 26 20 63 3c 3d 27 66 27 20 29 7b  'a' && c<='f' ){
3100: 0a 20 20 20 20 63 20 2d 3d 20 27 61 27 20 2d 20  .    c -= 'a' - 
3110: 31 30 3b 0a 20 20 7d 65 6c 73 65 20 69 66 28 20  10;.  }else if( 
3120: 63 3e 3d 27 41 27 20 26 26 20 63 3c 3d 27 46 27  c>='A' && c<='F'
3130: 20 29 7b 0a 20 20 20 20 63 20 2d 3d 20 27 41 27   ){.    c -= 'A'
3140: 20 2d 20 31 30 3b 0a 20 20 7d 65 6c 73 65 7b 0a   - 10;.  }else{.
3150: 20 20 20 20 72 65 74 75 72 6e 20 30 3b 0a 20 20      return 0;.  
3160: 7d 0a 20 20 2a 70 56 20 3d 20 28 2a 70 56 29 2a  }.  *pV = (*pV)*
3170: 31 36 20 2b 20 28 63 20 26 20 30 78 66 66 29 3b  16 + (c & 0xff);
3180: 0a 20 20 72 65 74 75 72 6e 20 31 3b 0a 7d 0a 0a  .  return 1;.}..
3190: 2f 2a 20 41 20 62 61 63 6b 73 6c 61 73 68 20 63  /* A backslash c
31a0: 68 61 72 61 63 74 65 72 20 68 61 73 20 62 65 65  haracter has bee
31b0: 6e 20 73 65 65 6e 2c 20 72 65 61 64 20 74 68 65  n seen, read the
31c0: 20 6e 65 78 74 20 63 68 61 72 61 63 74 65 72 20   next character 
31d0: 61 6e 64 0a 2a 2a 20 72 65 74 75 72 6e 20 69 74  and.** return it
31e0: 73 20 69 6e 74 65 70 72 65 74 61 74 69 6f 6e 2e  s intepretation.
31f0: 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e 73 69 67  .*/.static unsig
3200: 6e 65 64 20 72 65 5f 65 73 63 5f 63 68 61 72 28  ned re_esc_char(
3210: 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 29 7b 0a  ReCompiled *p){.
3220: 20 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 63    static const c
3230: 68 61 72 20 7a 45 73 63 5b 5d 20 3d 20 22 61 66  har zEsc[] = "af
3240: 6e 72 74 76 5c 5c 28 29 2a 2e 2b 3f 5b 24 5e 7b  nrtv\\()*.+?[$^{
3250: 7c 7d 5d 22 3b 0a 20 20 73 74 61 74 69 63 20 63  |}]";.  static c
3260: 6f 6e 73 74 20 63 68 61 72 20 7a 54 72 61 6e 73  onst char zTrans
3270: 5b 5d 20 3d 20 22 5c 61 5c 66 5c 6e 5c 72 5c 74  [] = "\a\f\n\r\t
3280: 5c 76 22 3b 0a 20 20 69 6e 74 20 69 2c 20 76 20  \v";.  int i, v 
3290: 3d 20 30 3b 0a 20 20 63 68 61 72 20 63 3b 0a 20  = 0;.  char c;. 
32a0: 20 69 66 28 20 70 2d 3e 73 49 6e 2e 69 3e 3d 70   if( p->sIn.i>=p
32b0: 2d 3e 73 49 6e 2e 6d 78 20 29 20 72 65 74 75 72  ->sIn.mx ) retur
32c0: 6e 20 30 3b 0a 20 20 63 20 3d 20 70 2d 3e 73 49  n 0;.  c = p->sI
32d0: 6e 2e 7a 5b 70 2d 3e 73 49 6e 2e 69 5d 3b 0a 20  n.z[p->sIn.i];. 
32e0: 20 69 66 28 20 63 3d 3d 27 75 27 20 26 26 20 70   if( c=='u' && p
32f0: 2d 3e 73 49 6e 2e 69 2b 35 3c 70 2d 3e 73 49 6e  ->sIn.i+5<p->sIn
3300: 2e 6d 78 20 29 7b 0a 20 20 20 20 63 6f 6e 73 74  .mx ){.    const
3310: 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a   unsigned char *
3320: 7a 49 6e 20 3d 20 70 2d 3e 73 49 6e 2e 7a 20 2b  zIn = p->sIn.z +
3330: 20 70 2d 3e 73 49 6e 2e 69 3b 0a 20 20 20 20 76   p->sIn.i;.    v
3340: 20 3d 20 30 3b 0a 20 20 20 20 69 66 28 20 72 65   = 0;.    if( re
3350: 5f 68 65 78 28 7a 49 6e 5b 31 5d 2c 26 76 29 0a  _hex(zIn[1],&v).
3360: 20 20 20 20 20 26 26 20 72 65 5f 68 65 78 28 7a       && re_hex(z
3370: 49 6e 5b 32 5d 2c 26 76 29 0a 20 20 20 20 20 26  In[2],&v).     &
3380: 26 20 72 65 5f 68 65 78 28 7a 49 6e 5b 33 5d 2c  & re_hex(zIn[3],
3390: 26 76 29 0a 20 20 20 20 20 26 26 20 72 65 5f 68  &v).     && re_h
33a0: 65 78 28 7a 49 6e 5b 34 5d 2c 26 76 29 0a 20 20  ex(zIn[4],&v).  
33b0: 20 20 29 7b 0a 20 20 20 20 20 20 70 2d 3e 73 49    ){.      p->sI
33c0: 6e 2e 69 20 2b 3d 20 35 3b 0a 20 20 20 20 20 20  n.i += 5;.      
33d0: 72 65 74 75 72 6e 20 76 3b 0a 20 20 20 20 7d 0a  return v;.    }.
33e0: 20 20 7d 0a 20 20 69 66 28 20 63 3d 3d 27 78 27    }.  if( c=='x'
33f0: 20 29 7b 0a 20 20 20 20 76 20 3d 20 30 3b 0a 20   ){.    v = 0;. 
3400: 20 20 20 66 6f 72 28 69 3d 31 3b 20 70 2d 3e 73     for(i=1; p->s
3410: 49 6e 2e 69 3c 70 2d 3e 73 49 6e 2e 6d 78 20 26  In.i<p->sIn.mx &
3420: 26 20 72 65 5f 68 65 78 28 70 2d 3e 73 49 6e 2e  & re_hex(p->sIn.
3430: 7a 5b 70 2d 3e 73 49 6e 2e 69 2b 69 5d 2c 20 26  z[p->sIn.i+i], &
3440: 76 29 3b 20 69 2b 2b 29 7b 7d 0a 20 20 20 20 69  v); i++){}.    i
3450: 66 28 20 69 3e 31 20 29 7b 0a 20 20 20 20 20 20  f( i>1 ){.      
3460: 70 2d 3e 73 49 6e 2e 69 20 2b 3d 20 69 3b 0a 20  p->sIn.i += i;. 
3470: 20 20 20 20 20 72 65 74 75 72 6e 20 76 3b 0a 20       return v;. 
3480: 20 20 20 7d 0a 20 20 7d 0a 20 20 66 6f 72 28 69     }.  }.  for(i
3490: 3d 30 3b 20 7a 45 73 63 5b 69 5d 20 26 26 20 7a  =0; zEsc[i] && z
34a0: 45 73 63 5b 69 5d 21 3d 63 3b 20 69 2b 2b 29 7b  Esc[i]!=c; i++){
34b0: 7d 0a 20 20 69 66 28 20 7a 45 73 63 5b 69 5d 20  }.  if( zEsc[i] 
34c0: 29 7b 0a 20 20 20 20 69 66 28 20 69 3c 36 20 29  ){.    if( i<6 )
34d0: 20 63 20 3d 20 7a 54 72 61 6e 73 5b 69 5d 3b 0a   c = zTrans[i];.
34e0: 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a      p->sIn.i++;.
34f0: 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 70 2d 3e    }else{.    p->
3500: 7a 45 72 72 20 3d 20 22 75 6e 6b 6e 6f 77 6e 20  zErr = "unknown 
3510: 5c 5c 20 65 73 63 61 70 65 22 3b 0a 20 20 7d 0a  \\ escape";.  }.
3520: 20 20 72 65 74 75 72 6e 20 63 3b 0a 7d 0a 0a 2f    return c;.}../
3530: 2a 20 46 6f 72 77 61 72 64 20 64 65 63 6c 61 72  * Forward declar
3540: 61 74 69 6f 6e 20 2a 2f 0a 73 74 61 74 69 63 20  ation */.static 
3550: 63 6f 6e 73 74 20 63 68 61 72 20 2a 72 65 5f 73  const char *re_s
3560: 75 62 63 6f 6d 70 69 6c 65 5f 73 74 72 69 6e 67  ubcompile_string
3570: 28 52 65 43 6f 6d 70 69 6c 65 64 2a 29 3b 0a 0a  (ReCompiled*);..
3580: 2f 2a 20 50 65 65 6b 20 61 74 20 74 68 65 20 6e  /* Peek at the n
3590: 65 78 74 20 62 79 74 65 20 6f 66 20 69 6e 70 75  ext byte of inpu
35a0: 74 20 2a 2f 0a 73 74 61 74 69 63 20 75 6e 73 69  t */.static unsi
35b0: 67 6e 65 64 20 63 68 61 72 20 72 65 50 65 65 6b  gned char rePeek
35c0: 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a 70 29 7b  (ReCompiled *p){
35d0: 0a 20 20 72 65 74 75 72 6e 20 70 2d 3e 73 49 6e  .  return p->sIn
35e0: 2e 69 3c 70 2d 3e 73 49 6e 2e 6d 78 20 3f 20 70  .i<p->sIn.mx ? p
35f0: 2d 3e 73 49 6e 2e 7a 5b 70 2d 3e 73 49 6e 2e 69  ->sIn.z[p->sIn.i
3600: 5d 20 3a 20 30 3b 0a 7d 0a 0a 2f 2a 20 43 6f 6d  ] : 0;.}../* Com
3610: 70 69 6c 65 20 52 45 20 74 65 78 74 20 69 6e 74  pile RE text int
3620: 6f 20 61 20 73 65 71 75 65 6e 63 65 20 6f 66 20  o a sequence of 
3630: 6f 70 63 6f 64 65 73 2e 20 20 43 6f 6e 74 69 6e  opcodes.  Contin
3640: 75 65 20 75 70 20 74 6f 20 74 68 65 0a 2a 2a 20  ue up to the.** 
3650: 66 69 72 73 74 20 75 6e 6d 61 74 63 68 65 64 20  first unmatched 
3660: 22 29 22 20 63 68 61 72 61 63 74 65 72 2c 20 74  ")" character, t
3670: 68 65 6e 20 72 65 74 75 72 6e 2e 20 20 49 66 20  hen return.  If 
3680: 61 6e 20 65 72 72 6f 72 20 69 73 20 66 6f 75 6e  an error is foun
3690: 64 2c 0a 2a 2a 20 72 65 74 75 72 6e 20 61 20 70  d,.** return a p
36a0: 6f 69 6e 74 65 72 20 74 6f 20 74 68 65 20 65 72  ointer to the er
36b0: 72 6f 72 20 6d 65 73 73 61 67 65 20 73 74 72 69  ror message stri
36c0: 6e 67 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 63 6f  ng..*/.static co
36d0: 6e 73 74 20 63 68 61 72 20 2a 72 65 5f 73 75 62  nst char *re_sub
36e0: 63 6f 6d 70 69 6c 65 5f 72 65 28 52 65 43 6f 6d  compile_re(ReCom
36f0: 70 69 6c 65 64 20 2a 70 29 7b 0a 20 20 63 6f 6e  piled *p){.  con
3700: 73 74 20 63 68 61 72 20 2a 7a 45 72 72 3b 0a 20  st char *zErr;. 
3710: 20 69 6e 74 20 69 53 74 61 72 74 2c 20 69 45 6e   int iStart, iEn
3720: 64 2c 20 69 47 6f 74 6f 3b 0a 20 20 69 53 74 61  d, iGoto;.  iSta
3730: 72 74 20 3d 20 70 2d 3e 6e 53 74 61 74 65 3b 0a  rt = p->nState;.
3740: 20 20 7a 45 72 72 20 3d 20 72 65 5f 73 75 62 63    zErr = re_subc
3750: 6f 6d 70 69 6c 65 5f 73 74 72 69 6e 67 28 70 29  ompile_string(p)
3760: 3b 0a 20 20 69 66 28 20 7a 45 72 72 20 29 20 72  ;.  if( zErr ) r
3770: 65 74 75 72 6e 20 7a 45 72 72 3b 0a 20 20 77 68  eturn zErr;.  wh
3780: 69 6c 65 28 20 72 65 50 65 65 6b 28 70 29 3d 3d  ile( rePeek(p)==
3790: 27 7c 27 20 29 7b 0a 20 20 20 20 69 45 6e 64 20  '|' ){.    iEnd 
37a0: 3d 20 70 2d 3e 6e 53 74 61 74 65 3b 0a 20 20 20  = p->nState;.   
37b0: 20 72 65 5f 69 6e 73 65 72 74 28 70 2c 20 69 53   re_insert(p, iS
37c0: 74 61 72 74 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b  tart, RE_OP_FORK
37d0: 2c 20 69 45 6e 64 20 2b 20 32 20 2d 20 69 53 74  , iEnd + 2 - iSt
37e0: 61 72 74 29 3b 0a 20 20 20 20 69 47 6f 74 6f 20  art);.    iGoto 
37f0: 3d 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52  = re_append(p, R
3800: 45 5f 4f 50 5f 47 4f 54 4f 2c 20 30 29 3b 0a 20  E_OP_GOTO, 0);. 
3810: 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20     p->sIn.i++;. 
3820: 20 20 20 7a 45 72 72 20 3d 20 72 65 5f 73 75 62     zErr = re_sub
3830: 63 6f 6d 70 69 6c 65 5f 73 74 72 69 6e 67 28 70  compile_string(p
3840: 29 3b 0a 20 20 20 20 69 66 28 20 7a 45 72 72 20  );.    if( zErr 
3850: 29 20 72 65 74 75 72 6e 20 7a 45 72 72 3b 0a 20  ) return zErr;. 
3860: 20 20 20 70 2d 3e 61 41 72 67 5b 69 47 6f 74 6f     p->aArg[iGoto
3870: 5d 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20 2d 20  ] = p->nState - 
3880: 69 47 6f 74 6f 3b 0a 20 20 7d 0a 20 20 72 65 74  iGoto;.  }.  ret
3890: 75 72 6e 20 30 3b 0a 7d 0a 0a 2f 2a 20 43 6f 6d  urn 0;.}../* Com
38a0: 70 69 6c 65 20 61 6e 20 65 6c 65 6d 65 6e 74 20  pile an element 
38b0: 6f 66 20 72 65 67 75 6c 61 72 20 65 78 70 72 65  of regular expre
38c0: 73 73 69 6f 6e 20 74 65 78 74 20 28 61 6e 79 74  ssion text (anyt
38d0: 68 69 6e 67 20 74 68 61 74 20 63 61 6e 20 62 65  hing that can be
38e0: 0a 2a 2a 20 61 6e 20 6f 70 65 72 61 6e 64 20 74  .** an operand t
38f0: 6f 20 74 68 65 20 22 7c 22 20 6f 70 65 72 61 74  o the "|" operat
3900: 6f 72 29 2e 20 20 52 65 74 75 72 6e 20 4e 55 4c  or).  Return NUL
3910: 4c 20 6f 6e 20 73 75 63 63 65 73 73 20 6f 72 20  L on success or 
3920: 61 20 70 6f 69 6e 74 65 72 0a 2a 2a 20 74 6f 20  a pointer.** to 
3930: 74 68 65 20 65 72 72 6f 72 20 6d 65 73 73 61 67  the error messag
3940: 65 20 69 66 20 74 68 65 72 65 20 69 73 20 61 20  e if there is a 
3950: 70 72 6f 62 6c 65 6d 2e 0a 2a 2f 0a 73 74 61 74  problem..*/.stat
3960: 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 72  ic const char *r
3970: 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 73 74 72  e_subcompile_str
3980: 69 6e 67 28 52 65 43 6f 6d 70 69 6c 65 64 20 2a  ing(ReCompiled *
3990: 70 29 7b 0a 20 20 69 6e 74 20 69 50 72 65 76 20  p){.  int iPrev 
39a0: 3d 20 2d 31 3b 0a 20 20 69 6e 74 20 69 53 74 61  = -1;.  int iSta
39b0: 72 74 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 63  rt;.  unsigned c
39c0: 3b 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a  ;.  const char *
39d0: 7a 45 72 72 3b 0a 20 20 77 68 69 6c 65 28 20 28  zErr;.  while( (
39e0: 63 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61 72  c = p->xNextChar
39f0: 28 26 70 2d 3e 73 49 6e 29 29 21 3d 30 20 29 7b  (&p->sIn))!=0 ){
3a00: 0a 20 20 20 20 69 53 74 61 72 74 20 3d 20 70 2d  .    iStart = p-
3a10: 3e 6e 53 74 61 74 65 3b 0a 20 20 20 20 73 77 69  >nState;.    swi
3a20: 74 63 68 28 20 63 20 29 7b 0a 20 20 20 20 20 20  tch( c ){.      
3a30: 63 61 73 65 20 27 7c 27 3a 0a 20 20 20 20 20 20  case '|':.      
3a40: 63 61 73 65 20 27 24 27 3a 20 0a 20 20 20 20 20  case '$': .     
3a50: 20 63 61 73 65 20 27 29 27 3a 20 7b 0a 20 20 20   case ')': {.   
3a60: 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2d 2d 3b       p->sIn.i--;
3a70: 0a 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20  .        return 
3a80: 30 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20  0;.      }.     
3a90: 20 63 61 73 65 20 27 28 27 3a 20 7b 0a 20 20 20   case '(': {.   
3aa0: 20 20 20 20 20 7a 45 72 72 20 3d 20 72 65 5f 73       zErr = re_s
3ab0: 75 62 63 6f 6d 70 69 6c 65 5f 72 65 28 70 29 3b  ubcompile_re(p);
3ac0: 0a 20 20 20 20 20 20 20 20 69 66 28 20 7a 45 72  .        if( zEr
3ad0: 72 20 29 20 72 65 74 75 72 6e 20 7a 45 72 72 3b  r ) return zErr;
3ae0: 0a 20 20 20 20 20 20 20 20 69 66 28 20 72 65 50  .        if( reP
3af0: 65 65 6b 28 70 29 21 3d 27 29 27 20 29 20 72 65  eek(p)!=')' ) re
3b00: 74 75 72 6e 20 22 75 6e 6d 61 74 63 68 65 64 20  turn "unmatched 
3b10: 27 28 27 22 3b 0a 20 20 20 20 20 20 20 20 70 2d  '('";.        p-
3b20: 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20 20  >sIn.i++;.      
3b30: 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d    break;.      }
3b40: 0a 20 20 20 20 20 20 63 61 73 65 20 27 2e 27 3a  .      case '.':
3b50: 20 7b 0a 20 20 20 20 20 20 20 20 69 66 28 20 72   {.        if( r
3b60: 65 50 65 65 6b 28 70 29 3d 3d 27 2a 27 20 29 7b  ePeek(p)=='*' ){
3b70: 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 70  .          re_ap
3b80: 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 41 4e  pend(p, RE_OP_AN
3b90: 59 53 54 41 52 2c 20 30 29 3b 0a 20 20 20 20 20  YSTAR, 0);.     
3ba0: 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b       p->sIn.i++;
3bb0: 0a 20 20 20 20 20 20 20 20 7d 65 6c 73 65 7b 20  .        }else{ 
3bc0: 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 70  .          re_ap
3bd0: 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 41 4e  pend(p, RE_OP_AN
3be0: 59 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20 7d  Y, 0);.        }
3bf0: 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a  .        break;.
3c00: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61        }.      ca
3c10: 73 65 20 27 2a 27 3a 20 7b 0a 20 20 20 20 20 20  se '*': {.      
3c20: 20 20 69 66 28 20 69 50 72 65 76 3c 30 20 29 20    if( iPrev<0 ) 
3c30: 72 65 74 75 72 6e 20 22 27 2a 27 20 77 69 74 68  return "'*' with
3c40: 6f 75 74 20 6f 70 65 72 61 6e 64 22 3b 0a 20 20  out operand";.  
3c50: 20 20 20 20 20 20 72 65 5f 69 6e 73 65 72 74 28        re_insert(
3c60: 70 2c 20 69 50 72 65 76 2c 20 52 45 5f 4f 50 5f  p, iPrev, RE_OP_
3c70: 47 4f 54 4f 2c 20 70 2d 3e 6e 53 74 61 74 65 20  GOTO, p->nState 
3c80: 2d 20 69 50 72 65 76 20 2b 20 31 29 3b 0a 20 20  - iPrev + 1);.  
3c90: 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28        re_append(
3ca0: 70 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20 69  p, RE_OP_FORK, i
3cb0: 50 72 65 76 20 2d 20 70 2d 3e 6e 53 74 61 74 65  Prev - p->nState
3cc0: 20 2b 20 31 29 3b 0a 20 20 20 20 20 20 20 20 62   + 1);.        b
3cd0: 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20  reak;.      }.  
3ce0: 20 20 20 20 63 61 73 65 20 27 2b 27 3a 20 7b 0a      case '+': {.
3cf0: 20 20 20 20 20 20 20 20 69 66 28 20 69 50 72 65          if( iPre
3d00: 76 3c 30 20 29 20 72 65 74 75 72 6e 20 22 27 2b  v<0 ) return "'+
3d10: 27 20 77 69 74 68 6f 75 74 20 6f 70 65 72 61 6e  ' without operan
3d20: 64 22 3b 0a 20 20 20 20 20 20 20 20 72 65 5f 61  d";.        re_a
3d30: 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 46  ppend(p, RE_OP_F
3d40: 4f 52 4b 2c 20 69 50 72 65 76 20 2d 20 70 2d 3e  ORK, iPrev - p->
3d50: 6e 53 74 61 74 65 29 3b 0a 20 20 20 20 20 20 20  nState);.       
3d60: 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a   break;.      }.
3d70: 20 20 20 20 20 20 63 61 73 65 20 27 3f 27 3a 20        case '?': 
3d80: 7b 0a 20 20 20 20 20 20 20 20 69 66 28 20 69 50  {.        if( iP
3d90: 72 65 76 3c 30 20 29 20 72 65 74 75 72 6e 20 22  rev<0 ) return "
3da0: 27 3f 27 20 77 69 74 68 6f 75 74 20 6f 70 65 72  '?' without oper
3db0: 61 6e 64 22 3b 0a 20 20 20 20 20 20 20 20 72 65  and";.        re
3dc0: 5f 69 6e 73 65 72 74 28 70 2c 20 69 50 72 65 76  _insert(p, iPrev
3dd0: 2c 20 52 45 5f 4f 50 5f 46 4f 52 4b 2c 20 70 2d  , RE_OP_FORK, p-
3de0: 3e 6e 53 74 61 74 65 20 2d 20 69 50 72 65 76 2b  >nState - iPrev+
3df0: 31 29 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61  1);.        brea
3e00: 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20  k;.      }.     
3e10: 20 63 61 73 65 20 27 7b 27 3a 20 7b 0a 20 20 20   case '{': {.   
3e20: 20 20 20 20 20 69 6e 74 20 6d 20 3d 20 30 2c 20       int m = 0, 
3e30: 6e 20 3d 20 30 3b 0a 20 20 20 20 20 20 20 20 69  n = 0;.        i
3e40: 6e 74 20 73 7a 2c 20 6a 3b 0a 20 20 20 20 20 20  nt sz, j;.      
3e50: 20 20 69 66 28 20 69 50 72 65 76 3c 30 20 29 20    if( iPrev<0 ) 
3e60: 72 65 74 75 72 6e 20 22 27 7b 6d 2c 6e 7d 27 20  return "'{m,n}' 
3e70: 77 69 74 68 6f 75 74 20 6f 70 65 72 61 6e 64 22  without operand"
3e80: 3b 0a 20 20 20 20 20 20 20 20 77 68 69 6c 65 28  ;.        while(
3e90: 20 28 63 3d 72 65 50 65 65 6b 28 70 29 29 3e 3d   (c=rePeek(p))>=
3ea0: 27 30 27 20 26 26 20 63 3c 3d 27 39 27 20 29 7b  '0' && c<='9' ){
3eb0: 20 6d 20 3d 20 6d 2a 31 30 20 2b 20 63 20 2d 20   m = m*10 + c - 
3ec0: 27 30 27 3b 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b  '0'; p->sIn.i++;
3ed0: 20 7d 0a 20 20 20 20 20 20 20 20 6e 20 3d 20 6d   }.        n = m
3ee0: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 63 3d  ;.        if( c=
3ef0: 3d 27 2c 27 20 29 7b 0a 20 20 20 20 20 20 20 20  =',' ){.        
3f00: 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20    p->sIn.i++;.  
3f10: 20 20 20 20 20 20 20 20 6e 20 3d 20 30 3b 0a 20          n = 0;. 
3f20: 20 20 20 20 20 20 20 20 20 77 68 69 6c 65 28 20           while( 
3f30: 28 63 3d 72 65 50 65 65 6b 28 70 29 29 3e 3d 27  (c=rePeek(p))>='
3f40: 30 27 20 26 26 20 63 3c 3d 27 39 27 20 29 7b 20  0' && c<='9' ){ 
3f50: 6e 20 3d 20 6e 2a 31 30 20 2b 20 63 2d 27 30 27  n = n*10 + c-'0'
3f60: 3b 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 20 7d 0a  ; p->sIn.i++; }.
3f70: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20          }.      
3f80: 20 20 69 66 28 20 63 21 3d 27 7d 27 20 29 20 72    if( c!='}' ) r
3f90: 65 74 75 72 6e 20 22 75 6e 6d 61 74 63 68 65 64  eturn "unmatched
3fa0: 20 27 7b 27 22 3b 0a 20 20 20 20 20 20 20 20 69   '{'";.        i
3fb0: 66 28 20 6e 3e 30 20 26 26 20 6e 3c 6d 20 29 20  f( n>0 && n<m ) 
3fc0: 72 65 74 75 72 6e 20 22 6e 20 6c 65 73 73 20 74  return "n less t
3fd0: 68 61 6e 20 6d 20 69 6e 20 27 7b 6d 2c 6e 7d 27  han m in '{m,n}'
3fe0: 22 3b 0a 20 20 20 20 20 20 20 20 70 2d 3e 73 49  ";.        p->sI
3ff0: 6e 2e 69 2b 2b 3b 0a 20 20 20 20 20 20 20 20 73  n.i++;.        s
4000: 7a 20 3d 20 70 2d 3e 6e 53 74 61 74 65 20 2d 20  z = p->nState - 
4010: 69 50 72 65 76 3b 0a 20 20 20 20 20 20 20 20 69  iPrev;.        i
4020: 66 28 20 6d 3d 3d 30 20 29 7b 0a 20 20 20 20 20  f( m==0 ){.     
4030: 20 20 20 20 20 69 66 28 20 6e 3d 3d 30 20 29 20       if( n==0 ) 
4040: 72 65 74 75 72 6e 20 22 62 6f 74 68 20 6d 20 61  return "both m a
4050: 6e 64 20 6e 20 61 72 65 20 7a 65 72 6f 20 69 6e  nd n are zero in
4060: 20 27 7b 6d 2c 6e 7d 27 22 3b 0a 20 20 20 20 20   '{m,n}'";.     
4070: 20 20 20 20 20 72 65 5f 69 6e 73 65 72 74 28 70       re_insert(p
4080: 2c 20 69 50 72 65 76 2c 20 52 45 5f 4f 50 5f 46  , iPrev, RE_OP_F
4090: 4f 52 4b 2c 20 73 7a 2b 31 29 3b 0a 20 20 20 20  ORK, sz+1);.    
40a0: 20 20 20 20 20 20 6e 2d 2d 3b 0a 20 20 20 20 20        n--;.     
40b0: 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20     }else{.      
40c0: 20 20 20 20 66 6f 72 28 6a 3d 31 3b 20 6a 3c 6d      for(j=1; j<m
40d0: 3b 20 6a 2b 2b 29 20 72 65 5f 63 6f 70 79 28 70  ; j++) re_copy(p
40e0: 2c 20 69 50 72 65 76 2c 20 73 7a 29 3b 0a 20 20  , iPrev, sz);.  
40f0: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20        }.        
4100: 66 6f 72 28 6a 3d 6d 3b 20 6a 3c 6e 3b 20 6a 2b  for(j=m; j<n; j+
4110: 2b 29 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65  +){.          re
4120: 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50  _append(p, RE_OP
4130: 5f 46 4f 52 4b 2c 20 73 7a 2b 31 29 3b 0a 20 20  _FORK, sz+1);.  
4140: 20 20 20 20 20 20 20 20 72 65 5f 63 6f 70 79 28          re_copy(
4150: 70 2c 20 69 50 72 65 76 2c 20 73 7a 29 3b 0a 20  p, iPrev, sz);. 
4160: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
4170: 20 69 66 28 20 6e 3d 3d 30 20 26 26 20 6d 3e 30   if( n==0 && m>0
4180: 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 72 65   ){.          re
4190: 5f 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50  _append(p, RE_OP
41a0: 5f 46 4f 52 4b 2c 20 2d 73 7a 29 3b 0a 20 20 20  _FORK, -sz);.   
41b0: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62       }.        b
41c0: 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20  reak;.      }.  
41d0: 20 20 20 20 63 61 73 65 20 27 5b 27 3a 20 7b 0a      case '[': {.
41e0: 20 20 20 20 20 20 20 20 69 6e 74 20 69 46 69 72          int iFir
41f0: 73 74 20 3d 20 70 2d 3e 6e 53 74 61 74 65 3b 0a  st = p->nState;.
4200: 20 20 20 20 20 20 20 20 69 66 28 20 72 65 50 65          if( rePe
4210: 65 6b 28 70 29 3d 3d 27 5e 27 20 29 7b 0a 20 20  ek(p)=='^' ){.  
4220: 20 20 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e          re_appen
4230: 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f 45 58  d(p, RE_OP_CC_EX
4240: 43 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20 20  C, 0);.         
4250: 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a 20 20 20   p->sIn.i++;.   
4260: 20 20 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20       }else{.    
4270: 20 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28        re_append(
4280: 70 2c 20 52 45 5f 4f 50 5f 43 43 5f 49 4e 43 2c  p, RE_OP_CC_INC,
4290: 20 30 29 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20   0);.        }. 
42a0: 20 20 20 20 20 20 20 77 68 69 6c 65 28 20 28 63         while( (c
42b0: 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61 72 28   = p->xNextChar(
42c0: 26 70 2d 3e 73 49 6e 29 29 21 3d 30 20 29 7b 0a  &p->sIn))!=0 ){.
42d0: 20 20 20 20 20 20 20 20 20 20 69 66 28 20 63 3d            if( c=
42e0: 3d 27 5b 27 20 26 26 20 72 65 50 65 65 6b 28 70  ='[' && rePeek(p
42f0: 29 3d 3d 27 3a 27 20 29 7b 0a 20 20 20 20 20 20  )==':' ){.      
4300: 20 20 20 20 20 20 72 65 74 75 72 6e 20 22 50 4f        return "PO
4310: 53 49 58 20 63 68 61 72 61 63 74 65 72 20 63 6c  SIX character cl
4320: 61 73 73 65 73 20 6e 6f 74 20 73 75 70 70 6f 72  asses not suppor
4330: 74 65 64 22 3b 0a 20 20 20 20 20 20 20 20 20 20  ted";.          
4340: 7d 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20  }.          if( 
4350: 63 3d 3d 27 5c 5c 27 20 29 20 63 20 3d 20 72 65  c=='\\' ) c = re
4360: 5f 65 73 63 5f 63 68 61 72 28 70 29 3b 0a 20 20  _esc_char(p);.  
4370: 20 20 20 20 20 20 20 20 69 66 28 20 72 65 50 65          if( rePe
4380: 65 6b 28 70 29 3d 3d 27 2d 27 20 29 7b 0a 20 20  ek(p)=='-' ){.  
4390: 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 70 70            re_app
43a0: 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f 43 43 5f  end(p, RE_OP_CC_
43b0: 52 41 4e 47 45 2c 20 63 29 3b 0a 20 20 20 20 20  RANGE, c);.     
43c0: 20 20 20 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b         p->sIn.i+
43d0: 2b 3b 0a 20 20 20 20 20 20 20 20 20 20 20 20 63  +;.            c
43e0: 20 3d 20 70 2d 3e 78 4e 65 78 74 43 68 61 72 28   = p->xNextChar(
43f0: 26 70 2d 3e 73 49 6e 29 3b 0a 20 20 20 20 20 20  &p->sIn);.      
4400: 20 20 20 20 20 20 69 66 28 20 63 3d 3d 27 5c 5c        if( c=='\\
4410: 27 20 29 20 63 20 3d 20 72 65 5f 65 73 63 5f 63  ' ) c = re_esc_c
4420: 68 61 72 28 70 29 3b 0a 20 20 20 20 20 20 20 20  har(p);.        
4430: 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c      re_append(p,
4440: 20 52 45 5f 4f 50 5f 43 43 5f 52 41 4e 47 45 2c   RE_OP_CC_RANGE,
4450: 20 63 29 3b 0a 20 20 20 20 20 20 20 20 20 20 7d   c);.          }
4460: 65 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20 20  else{.          
4470: 20 20 72 65 5f 61 70 70 65 6e 64 28 70 2c 20 52    re_append(p, R
4480: 45 5f 4f 50 5f 43 43 5f 56 41 4c 55 45 2c 20 63  E_OP_CC_VALUE, c
4490: 29 3b 0a 20 20 20 20 20 20 20 20 20 20 7d 0a 20  );.          }. 
44a0: 20 20 20 20 20 20 20 20 20 69 66 28 20 72 65 50           if( reP
44b0: 65 65 6b 28 70 29 3d 3d 27 5d 27 20 29 7b 20 70  eek(p)==']' ){ p
44c0: 2d 3e 73 49 6e 2e 69 2b 2b 3b 20 62 72 65 61 6b  ->sIn.i++; break
44d0: 3b 20 7d 0a 20 20 20 20 20 20 20 20 7d 0a 20 20  ; }.        }.  
44e0: 20 20 20 20 20 20 69 66 28 20 63 3d 3d 30 20 29        if( c==0 )
44f0: 20 72 65 74 75 72 6e 20 22 75 6e 63 6c 6f 73 65   return "unclose
4500: 64 20 27 5b 27 22 3b 0a 20 20 20 20 20 20 20 20  d '['";.        
4510: 70 2d 3e 61 41 72 67 5b 69 46 69 72 73 74 5d 20  p->aArg[iFirst] 
4520: 3d 20 70 2d 3e 6e 53 74 61 74 65 20 2d 20 69 46  = p->nState - iF
4530: 69 72 73 74 3b 0a 20 20 20 20 20 20 20 20 62 72  irst;.        br
4540: 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20  eak;.      }.   
4550: 20 20 20 63 61 73 65 20 27 5c 5c 27 3a 20 7b 0a     case '\\': {.
4560: 20 20 20 20 20 20 20 20 69 6e 74 20 73 70 65 63          int spec
4570: 69 61 6c 4f 70 20 3d 20 30 3b 0a 20 20 20 20 20  ialOp = 0;.     
4580: 20 20 20 73 77 69 74 63 68 28 20 72 65 50 65 65     switch( rePee
4590: 6b 28 70 29 20 29 7b 0a 20 20 20 20 20 20 20 20  k(p) ){.        
45a0: 20 20 63 61 73 65 20 27 62 27 3a 20 73 70 65 63    case 'b': spec
45b0: 69 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f 42 4f  ialOp = RE_OP_BO
45c0: 55 4e 44 41 52 59 3b 20 20 20 62 72 65 61 6b 3b  UNDARY;   break;
45d0: 0a 20 20 20 20 20 20 20 20 20 20 63 61 73 65 20  .          case 
45e0: 27 64 27 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d  'd': specialOp =
45f0: 20 52 45 5f 4f 50 5f 44 49 47 49 54 3b 20 20 20   RE_OP_DIGIT;   
4600: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20     break;.      
4610: 20 20 20 20 63 61 73 65 20 27 44 27 3a 20 73 70      case 'D': sp
4620: 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f 50 5f  ecialOp = RE_OP_
4630: 4e 4f 54 44 49 47 49 54 3b 20 20 20 62 72 65 61  NOTDIGIT;   brea
4640: 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 63 61 73  k;.          cas
4650: 65 20 27 73 27 3a 20 73 70 65 63 69 61 6c 4f 70  e 's': specialOp
4660: 20 3d 20 52 45 5f 4f 50 5f 53 50 41 43 45 3b 20   = RE_OP_SPACE; 
4670: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20       break;.    
4680: 20 20 20 20 20 20 63 61 73 65 20 27 53 27 3a 20        case 'S': 
4690: 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45 5f 4f  specialOp = RE_O
46a0: 50 5f 4e 4f 54 53 50 41 43 45 3b 20 20 20 62 72  P_NOTSPACE;   br
46b0: 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 63  eak;.          c
46c0: 61 73 65 20 27 77 27 3a 20 73 70 65 63 69 61 6c  ase 'w': special
46d0: 4f 70 20 3d 20 52 45 5f 4f 50 5f 57 4f 52 44 3b  Op = RE_OP_WORD;
46e0: 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20         break;.  
46f0: 20 20 20 20 20 20 20 20 63 61 73 65 20 27 57 27          case 'W'
4700: 3a 20 73 70 65 63 69 61 6c 4f 70 20 3d 20 52 45  : specialOp = RE
4710: 5f 4f 50 5f 4e 4f 54 57 4f 52 44 3b 20 20 20 20  _OP_NOTWORD;    
4720: 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d  break;.        }
4730: 0a 20 20 20 20 20 20 20 20 69 66 28 20 73 70 65  .        if( spe
4740: 63 69 61 6c 4f 70 20 29 7b 0a 20 20 20 20 20 20  cialOp ){.      
4750: 20 20 20 20 70 2d 3e 73 49 6e 2e 69 2b 2b 3b 0a      p->sIn.i++;.
4760: 20 20 20 20 20 20 20 20 20 20 72 65 5f 61 70 70            re_app
4770: 65 6e 64 28 70 2c 20 73 70 65 63 69 61 6c 4f 70  end(p, specialOp
4780: 2c 20 30 29 3b 0a 20 20 20 20 20 20 20 20 7d 65  , 0);.        }e
4790: 6c 73 65 7b 0a 20 20 20 20 20 20 20 20 20 20 63  lse{.          c
47a0: 20 3d 20 72 65 5f 65 73 63 5f 63 68 61 72 28 70   = re_esc_char(p
47b0: 29 3b 0a 20 20 20 20 20 20 20 20 20 20 72 65 5f  );.          re_
47c0: 61 70 70 65 6e 64 28 70 2c 20 52 45 5f 4f 50 5f  append(p, RE_OP_
47d0: 4d 41 54 43 48 2c 20 63 29 3b 0a 20 20 20 20 20  MATCH, c);.     
47e0: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62 72 65     }.        bre
47f0: 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20  ak;.      }.    
4800: 20 20 64 65 66 61 75 6c 74 3a 20 7b 0a 20 20 20    default: {.   
4810: 20 20 20 20 20 72 65 5f 61 70 70 65 6e 64 28 70       re_append(p
4820: 2c 20 52 45 5f 4f 50 5f 4d 41 54 43 48 2c 20 63  , RE_OP_MATCH, c
4830: 29 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b  );.        break
4840: 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 7d 0a  ;.      }.    }.
4850: 20 20 20 20 69 50 72 65 76 20 3d 20 69 53 74 61      iPrev = iSta
4860: 72 74 3b 0a 20 20 7d 0a 20 20 72 65 74 75 72 6e  rt;.  }.  return
4870: 20 30 3b 0a 7d 0a 0a 2f 2a 20 46 72 65 65 20 61   0;.}../* Free a
4880: 6e 64 20 72 65 63 6c 61 69 6d 20 61 6c 6c 20 74  nd reclaim all t
4890: 68 65 20 6d 65 6d 6f 72 79 20 75 73 65 64 20 62  he memory used b
48a0: 79 20 61 20 70 72 65 76 69 6f 75 73 6c 79 20 63  y a previously c
48b0: 6f 6d 70 69 6c 65 64 0a 2a 2a 20 72 65 67 75 6c  ompiled.** regul
48c0: 61 72 20 65 78 70 72 65 73 73 69 6f 6e 2e 20 20  ar expression.  
48d0: 41 70 70 6c 69 63 61 74 69 6f 6e 73 20 73 68 6f  Applications sho
48e0: 75 6c 64 20 69 6e 76 6f 6b 65 20 74 68 69 73 20  uld invoke this 
48f0: 72 6f 75 74 69 6e 65 20 6f 6e 63 65 0a 2a 2a 20  routine once.** 
4900: 66 6f 72 20 65 76 65 72 79 20 63 61 6c 6c 20 74  for every call t
4910: 6f 20 72 65 5f 63 6f 6d 70 69 6c 65 28 29 20 74  o re_compile() t
4920: 6f 20 61 76 6f 69 64 20 6d 65 6d 6f 72 79 20 6c  o avoid memory l
4930: 65 61 6b 73 2e 0a 2a 2f 0a 76 6f 69 64 20 72 65  eaks..*/.void re
4940: 5f 66 72 65 65 28 52 65 43 6f 6d 70 69 6c 65 64  _free(ReCompiled
4950: 20 2a 70 52 65 29 7b 0a 20 20 69 66 28 20 70 52   *pRe){.  if( pR
4960: 65 20 29 7b 0a 20 20 20 20 73 71 6c 69 74 65 33  e ){.    sqlite3
4970: 5f 66 72 65 65 28 70 52 65 2d 3e 61 4f 70 29 3b  _free(pRe->aOp);
4980: 0a 20 20 20 20 73 71 6c 69 74 65 33 5f 66 72 65  .    sqlite3_fre
4990: 65 28 70 52 65 2d 3e 61 41 72 67 29 3b 0a 20 20  e(pRe->aArg);.  
49a0: 20 20 73 71 6c 69 74 65 33 5f 66 72 65 65 28 70    sqlite3_free(p
49b0: 52 65 29 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a  Re);.  }.}../*.*
49c0: 2a 20 43 6f 6d 70 69 6c 65 20 61 20 74 65 78 74  * Compile a text
49d0: 75 61 6c 20 72 65 67 75 6c 61 72 20 65 78 70 72  ual regular expr
49e0: 65 73 73 69 6f 6e 20 69 6e 20 7a 49 6e 5b 5d 20  ession in zIn[] 
49f0: 69 6e 74 6f 20 61 20 63 6f 6d 70 69 6c 65 64 20  into a compiled 
4a00: 72 65 67 75 6c 61 72 0a 2a 2a 20 65 78 70 72 65  regular.** expre
4a10: 73 73 69 6f 6e 20 73 75 69 74 61 62 6c 65 20 66  ssion suitable f
4a20: 6f 72 20 75 73 20 62 79 20 72 65 5f 6d 61 74 63  or us by re_matc
4a30: 68 28 29 20 61 6e 64 20 72 65 74 75 72 6e 20 61  h() and return a
4a40: 20 70 6f 69 6e 74 65 72 20 74 6f 20 74 68 65 0a   pointer to the.
4a50: 2a 2a 20 63 6f 6d 70 69 6c 65 64 20 72 65 67 75  ** compiled regu
4a60: 6c 61 72 20 65 78 70 72 65 73 73 69 6f 6e 20 69  lar expression i
4a70: 6e 20 2a 70 70 52 65 2e 20 20 52 65 74 75 72 6e  n *ppRe.  Return
4a80: 20 4e 55 4c 4c 20 6f 6e 20 73 75 63 63 65 73 73   NULL on success
4a90: 20 6f 72 20 61 6e 0a 2a 2a 20 65 72 72 6f 72 20   or an.** error 
4aa0: 6d 65 73 73 61 67 65 20 69 66 20 73 6f 6d 65 74  message if somet
4ab0: 68 69 6e 67 20 67 6f 65 73 20 77 72 6f 6e 67 2e  hing goes wrong.
4ac0: 0a 2a 2f 0a 63 6f 6e 73 74 20 63 68 61 72 20 2a  .*/.const char *
4ad0: 72 65 5f 63 6f 6d 70 69 6c 65 28 52 65 43 6f 6d  re_compile(ReCom
4ae0: 70 69 6c 65 64 20 2a 2a 70 70 52 65 2c 20 63 6f  piled **ppRe, co
4af0: 6e 73 74 20 63 68 61 72 20 2a 7a 49 6e 2c 20 69  nst char *zIn, i
4b00: 6e 74 20 6e 6f 43 61 73 65 29 7b 0a 20 20 52 65  nt noCase){.  Re
4b10: 43 6f 6d 70 69 6c 65 64 20 2a 70 52 65 3b 0a 20  Compiled *pRe;. 
4b20: 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 45 72   const char *zEr
4b30: 72 3b 0a 20 20 69 6e 74 20 69 2c 20 6a 3b 0a 0a  r;.  int i, j;..
4b40: 20 20 2a 70 70 52 65 20 3d 20 30 3b 0a 20 20 70    *ppRe = 0;.  p
4b50: 52 65 20 3d 20 73 71 6c 69 74 65 33 5f 6d 61 6c  Re = sqlite3_mal
4b60: 6c 6f 63 28 20 73 69 7a 65 6f 66 28 2a 70 52 65  loc( sizeof(*pRe
4b70: 29 20 29 3b 0a 20 20 69 66 28 20 70 52 65 3d 3d  ) );.  if( pRe==
4b80: 30 20 29 7b 0a 20 20 20 20 72 65 74 75 72 6e 20  0 ){.    return 
4b90: 22 6f 75 74 20 6f 66 20 6d 65 6d 6f 72 79 22 3b  "out of memory";
4ba0: 0a 20 20 7d 0a 20 20 6d 65 6d 73 65 74 28 70 52  .  }.  memset(pR
4bb0: 65 2c 20 30 2c 20 73 69 7a 65 6f 66 28 2a 70 52  e, 0, sizeof(*pR
4bc0: 65 29 29 3b 0a 20 20 70 52 65 2d 3e 78 4e 65 78  e));.  pRe->xNex
4bd0: 74 43 68 61 72 20 3d 20 6e 6f 43 61 73 65 20 3f  tChar = noCase ?
4be0: 20 72 65 5f 6e 65 78 74 5f 63 68 61 72 5f 6e 6f   re_next_char_no
4bf0: 63 61 73 65 20 3a 20 72 65 5f 6e 65 78 74 5f 63  case : re_next_c
4c00: 68 61 72 3b 0a 20 20 69 66 28 20 72 65 5f 72 65  har;.  if( re_re
4c10: 73 69 7a 65 28 70 52 65 2c 20 33 30 29 20 29 7b  size(pRe, 30) ){
4c20: 0a 20 20 20 20 72 65 5f 66 72 65 65 28 70 52 65  .    re_free(pRe
4c30: 29 3b 0a 20 20 20 20 72 65 74 75 72 6e 20 22 6f  );.    return "o
4c40: 75 74 20 6f 66 20 6d 65 6d 6f 72 79 22 3b 0a 20  ut of memory";. 
4c50: 20 7d 0a 20 20 69 66 28 20 7a 49 6e 5b 30 5d 3d   }.  if( zIn[0]=
4c60: 3d 27 5e 27 20 29 7b 0a 20 20 20 20 7a 49 6e 2b  ='^' ){.    zIn+
4c70: 2b 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20  +;.  }else{.    
4c80: 72 65 5f 61 70 70 65 6e 64 28 70 52 65 2c 20 52  re_append(pRe, R
4c90: 45 5f 4f 50 5f 41 4e 59 53 54 41 52 2c 20 30 29  E_OP_ANYSTAR, 0)
4ca0: 3b 0a 20 20 7d 0a 20 20 70 52 65 2d 3e 73 49 6e  ;.  }.  pRe->sIn
4cb0: 2e 7a 20 3d 20 28 75 6e 73 69 67 6e 65 64 20 63  .z = (unsigned c
4cc0: 68 61 72 2a 29 7a 49 6e 3b 0a 20 20 70 52 65 2d  har*)zIn;.  pRe-
4cd0: 3e 73 49 6e 2e 69 20 3d 20 30 3b 0a 20 20 70 52  >sIn.i = 0;.  pR
4ce0: 65 2d 3e 73 49 6e 2e 6d 78 20 3d 20 73 74 72 6c  e->sIn.mx = strl
4cf0: 65 6e 28 28 63 68 61 72 2a 29 70 52 65 2d 3e 73  en((char*)pRe->s
4d00: 49 6e 2e 7a 29 3b 0a 20 20 7a 45 72 72 20 3d 20  In.z);.  zErr = 
4d10: 72 65 5f 73 75 62 63 6f 6d 70 69 6c 65 5f 72 65  re_subcompile_re
4d20: 28 70 52 65 29 3b 0a 20 20 69 66 28 20 7a 45 72  (pRe);.  if( zEr
4d30: 72 20 29 7b 0a 20 20 20 20 72 65 5f 66 72 65 65  r ){.    re_free
4d40: 28 70 52 65 29 3b 0a 20 20 20 20 72 65 74 75 72  (pRe);.    retur
4d50: 6e 20 7a 45 72 72 3b 0a 20 20 7d 0a 20 20 69 66  n zErr;.  }.  if
4d60: 28 20 72 65 50 65 65 6b 28 70 52 65 29 3d 3d 27  ( rePeek(pRe)=='
4d70: 24 27 20 26 26 20 70 52 65 2d 3e 73 49 6e 2e 69  $' && pRe->sIn.i
4d80: 2b 31 3e 3d 70 52 65 2d 3e 73 49 6e 2e 6d 78 20  +1>=pRe->sIn.mx 
4d90: 29 7b 0a 20 20 20 20 72 65 5f 61 70 70 65 6e 64  ){.    re_append
4da0: 28 70 52 65 2c 20 52 45 5f 4f 50 5f 4d 41 54 43  (pRe, RE_OP_MATC
4db0: 48 2c 20 52 45 5f 45 4f 46 29 3b 0a 20 20 20 20  H, RE_EOF);.    
4dc0: 72 65 5f 61 70 70 65 6e 64 28 70 52 65 2c 20 52  re_append(pRe, R
4dd0: 45 5f 4f 50 5f 41 43 43 45 50 54 2c 20 30 29 3b  E_OP_ACCEPT, 0);
4de0: 0a 20 20 20 20 2a 70 70 52 65 20 3d 20 70 52 65  .    *ppRe = pRe
4df0: 3b 0a 20 20 7d 65 6c 73 65 20 69 66 28 20 70 52  ;.  }else if( pR
4e00: 65 2d 3e 73 49 6e 2e 69 3e 3d 70 52 65 2d 3e 73  e->sIn.i>=pRe->s
4e10: 49 6e 2e 6d 78 20 29 7b 0a 20 20 20 20 72 65 5f  In.mx ){.    re_
4e20: 61 70 70 65 6e 64 28 70 52 65 2c 20 52 45 5f 4f  append(pRe, RE_O
4e30: 50 5f 41 43 43 45 50 54 2c 20 30 29 3b 0a 20 20  P_ACCEPT, 0);.  
4e40: 20 20 2a 70 70 52 65 20 3d 20 70 52 65 3b 0a 20    *ppRe = pRe;. 
4e50: 20 7d 65 6c 73 65 7b 0a 20 20 20 20 72 65 5f 66   }else{.    re_f
4e60: 72 65 65 28 70 52 65 29 3b 0a 20 20 20 20 72 65  ree(pRe);.    re
4e70: 74 75 72 6e 20 22 75 6e 72 65 63 6f 67 6e 69 7a  turn "unrecogniz
4e80: 65 64 20 63 68 61 72 61 63 74 65 72 22 3b 0a 20  ed character";. 
4e90: 20 7d 0a 20 20 69 66 28 20 70 52 65 2d 3e 61 4f   }.  if( pRe->aO
4ea0: 70 5b 30 5d 3d 3d 52 45 5f 4f 50 5f 41 4e 59 53  p[0]==RE_OP_ANYS
4eb0: 54 41 52 20 29 7b 0a 20 20 20 20 66 6f 72 28 6a  TAR ){.    for(j
4ec0: 3d 30 2c 20 69 3d 31 3b 20 6a 3c 73 69 7a 65 6f  =0, i=1; j<sizeo
4ed0: 66 28 70 52 65 2d 3e 7a 49 6e 69 74 29 2d 32 20  f(pRe->zInit)-2 
4ee0: 26 26 20 70 52 65 2d 3e 61 4f 70 5b 69 5d 3d 3d  && pRe->aOp[i]==
4ef0: 52 45 5f 4f 50 5f 4d 41 54 43 48 3b 20 69 2b 2b  RE_OP_MATCH; i++
4f00: 29 7b 0a 20 20 20 20 20 20 75 6e 73 69 67 6e 65  ){.      unsigne
4f10: 64 20 78 20 3d 20 70 52 65 2d 3e 61 41 72 67 5b  d x = pRe->aArg[
4f20: 69 5d 3b 0a 20 20 20 20 20 20 69 66 28 20 78 3c  i];.      if( x<
4f30: 3d 31 32 37 20 29 7b 0a 20 20 20 20 20 20 20 20  =127 ){.        
4f40: 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b 5d 20  pRe->zInit[j++] 
4f50: 3d 20 78 3b 0a 20 20 20 20 20 20 7d 65 6c 73 65  = x;.      }else
4f60: 20 69 66 28 20 78 3c 3d 30 78 66 66 66 20 29 7b   if( x<=0xfff ){
4f70: 0a 20 20 20 20 20 20 20 20 70 52 65 2d 3e 7a 49  .        pRe->zI
4f80: 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 30 78 63 30 20  nit[j++] = 0xc0 
4f90: 7c 20 28 78 3e 3e 36 29 3b 0a 20 20 20 20 20 20  | (x>>6);.      
4fa0: 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a 2b 2b    pRe->zInit[j++
4fb0: 5d 20 3d 20 30 78 38 30 20 7c 20 28 78 26 30 78  ] = 0x80 | (x&0x
4fc0: 33 66 29 3b 0a 20 20 20 20 20 20 7d 65 6c 73 65  3f);.      }else
4fd0: 20 69 66 28 20 78 3c 3d 30 78 66 66 66 66 20 29   if( x<=0xffff )
4fe0: 7b 0a 20 20 20 20 20 20 20 20 70 52 65 2d 3e 7a  {.        pRe->z
4ff0: 49 6e 69 74 5b 6a 2b 2b 5d 20 3d 20 30 78 64 30  Init[j++] = 0xd0
5000: 20 7c 20 28 78 3e 3e 31 32 29 3b 0a 20 20 20 20   | (x>>12);.    
5010: 20 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a      pRe->zInit[j
5020: 2b 2b 5d 20 3d 20 30 78 38 30 20 7c 20 28 28 78  ++] = 0x80 | ((x
5030: 3e 3e 36 29 26 30 78 33 66 29 3b 0a 20 20 20 20  >>6)&0x3f);.    
5040: 20 20 20 20 70 52 65 2d 3e 7a 49 6e 69 74 5b 6a      pRe->zInit[j
5050: 2b 2b 5d 20 3d 20 30 78 38 30 20 7c 20 28 30 78  ++] = 0x80 | (0x
5060: 33 66 29 3b 0a 20 20 20 20 20 20 7d 65 6c 73 65  3f);.      }else
5070: 7b 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b  {.        break;
5080: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 7d 0a 20  .      }.    }. 
5090: 20 20 20 69 66 28 20 6a 3e 30 20 26 26 20 70 52     if( j>0 && pR
50a0: 65 2d 3e 7a 49 6e 69 74 5b 6a 2d 31 5d 3d 3d 30  e->zInit[j-1]==0
50b0: 20 29 20 6a 2d 2d 3b 0a 20 20 20 20 70 52 65 2d   ) j--;.    pRe-
50c0: 3e 6e 49 6e 69 74 20 3d 20 6a 3b 0a 20 20 7d 0a  >nInit = j;.  }.
50d0: 20 20 72 65 74 75 72 6e 20 70 52 65 2d 3e 7a 45    return pRe->zE
50e0: 72 72 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 49 6d 70  rr;.}../*.** Imp
50f0: 6c 65 6d 65 6e 74 61 74 69 6f 6e 20 6f 66 20 74  lementation of t
5100: 68 65 20 72 65 67 65 78 70 28 29 20 53 51 4c 20  he regexp() SQL 
5110: 66 75 6e 63 74 69 6f 6e 2e 20 20 54 68 69 73 20  function.  This 
5120: 66 75 6e 63 74 69 6f 6e 20 69 6d 70 6c 65 6d 65  function impleme
5130: 6e 74 73 0a 2a 2a 20 74 68 65 20 62 75 69 6c 64  nts.** the build
5140: 2d 69 6e 20 52 45 47 45 58 50 20 6f 70 65 72 61  -in REGEXP opera
5150: 74 6f 72 2e 20 20 54 68 65 20 66 69 72 73 74 20  tor.  The first 
5160: 61 72 67 75 6d 65 6e 74 20 74 6f 20 74 68 65 20  argument to the 
5170: 66 75 6e 63 74 69 6f 6e 20 69 73 20 74 68 65 0a  function is the.
5180: 2a 2a 20 70 61 74 74 65 72 6e 20 61 6e 64 20 74  ** pattern and t
5190: 68 65 20 73 65 63 6f 6e 64 20 61 72 67 75 6d 65  he second argume
51a0: 6e 74 20 69 73 20 74 68 65 20 73 74 72 69 6e 67  nt is the string
51b0: 2e 20 20 53 6f 2c 20 74 68 65 20 53 51 4c 20 73  .  So, the SQL s
51c0: 74 61 74 65 6d 65 6e 74 73 3a 0a 2a 2a 0a 2a 2a  tatements:.**.**
51d0: 20 20 20 20 20 20 20 41 20 52 45 47 45 58 50 20         A REGEXP 
51e0: 42 0a 2a 2a 0a 2a 2a 20 69 73 20 69 6d 70 6c 65  B.**.** is imple
51f0: 6d 65 6e 74 65 64 20 61 73 20 72 65 67 65 78 70  mented as regexp
5200: 28 42 2c 41 29 2e 0a 2a 2f 0a 73 74 61 74 69 63  (B,A)..*/.static
5210: 20 76 6f 69 64 20 72 65 5f 73 71 6c 5f 66 75 6e   void re_sql_fun
5220: 63 28 0a 20 20 73 71 6c 69 74 65 33 5f 63 6f 6e  c(.  sqlite3_con
5230: 74 65 78 74 20 2a 63 6f 6e 74 65 78 74 2c 20 0a  text *context, .
5240: 20 20 69 6e 74 20 61 72 67 63 2c 20 0a 20 20 73    int argc, .  s
5250: 71 6c 69 74 65 33 5f 76 61 6c 75 65 20 2a 2a 61  qlite3_value **a
5260: 72 67 76 0a 29 7b 0a 20 20 52 65 43 6f 6d 70 69  rgv.){.  ReCompi
5270: 6c 65 64 20 2a 70 52 65 3b 20 20 20 20 20 20 20  led *pRe;       
5280: 20 20 20 2f 2a 20 43 6f 6d 70 69 6c 65 64 20 72     /* Compiled r
5290: 65 67 75 6c 61 72 20 65 78 70 72 65 73 73 69 6f  egular expressio
52a0: 6e 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63 68 61  n */.  const cha
52b0: 72 20 2a 7a 50 61 74 74 65 72 6e 3b 20 20 20 20  r *zPattern;    
52c0: 20 2f 2a 20 54 68 65 20 72 65 67 75 6c 61 72 20   /* The regular 
52d0: 65 78 70 72 65 73 73 69 6f 6e 20 2a 2f 0a 20 20  expression */.  
52e0: 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 20 63  const unsigned c
52f0: 68 61 72 20 2a 7a 53 74 72 3b 2f 2a 20 53 74 72  har *zStr;/* Str
5300: 69 6e 67 20 62 65 69 6e 67 20 73 65 61 72 63 68  ing being search
5310: 65 64 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63 68  ed */.  const ch
5320: 61 72 20 2a 7a 45 72 72 3b 20 20 20 20 20 20 20  ar *zErr;       
5330: 20 20 2f 2a 20 43 6f 6d 70 69 6c 65 20 65 72 72    /* Compile err
5340: 6f 72 20 6d 65 73 73 61 67 65 20 2a 2f 0a 0a 20  or message */.. 
5350: 20 70 52 65 20 3d 20 73 71 6c 69 74 65 33 5f 67   pRe = sqlite3_g
5360: 65 74 5f 61 75 78 64 61 74 61 28 63 6f 6e 74 65  et_auxdata(conte
5370: 78 74 2c 20 30 29 3b 0a 20 20 69 66 28 20 70 52  xt, 0);.  if( pR
5380: 65 3d 3d 30 20 29 7b 0a 20 20 20 20 7a 50 61 74  e==0 ){.    zPat
5390: 74 65 72 6e 20 3d 20 28 63 6f 6e 73 74 20 63 68  tern = (const ch
53a0: 61 72 2a 29 73 71 6c 69 74 65 33 5f 76 61 6c 75  ar*)sqlite3_valu
53b0: 65 5f 74 65 78 74 28 61 72 67 76 5b 30 5d 29 3b  e_text(argv[0]);
53c0: 0a 20 20 20 20 69 66 28 20 7a 50 61 74 74 65 72  .    if( zPatter
53d0: 6e 3d 3d 30 20 29 20 72 65 74 75 72 6e 3b 0a 20  n==0 ) return;. 
53e0: 20 20 20 7a 45 72 72 20 3d 20 72 65 5f 63 6f 6d     zErr = re_com
53f0: 70 69 6c 65 28 26 70 52 65 2c 20 7a 50 61 74 74  pile(&pRe, zPatt
5400: 65 72 6e 2c 20 30 29 3b 0a 20 20 20 20 69 66 28  ern, 0);.    if(
5410: 20 7a 45 72 72 20 29 7b 0a 20 20 20 20 20 20 72   zErr ){.      r
5420: 65 5f 66 72 65 65 28 70 52 65 29 3b 0a 20 20 20  e_free(pRe);.   
5430: 20 20 20 73 71 6c 69 74 65 33 5f 72 65 73 75 6c     sqlite3_resul
5440: 74 5f 65 72 72 6f 72 28 63 6f 6e 74 65 78 74 2c  t_error(context,
5450: 20 7a 45 72 72 2c 20 2d 31 29 3b 0a 20 20 20 20   zErr, -1);.    
5460: 20 20 72 65 74 75 72 6e 3b 0a 20 20 20 20 7d 0a    return;.    }.
5470: 20 20 20 20 69 66 28 20 70 52 65 3d 3d 30 20 29      if( pRe==0 )
5480: 7b 0a 20 20 20 20 20 20 73 71 6c 69 74 65 33 5f  {.      sqlite3_
5490: 72 65 73 75 6c 74 5f 65 72 72 6f 72 5f 6e 6f 6d  result_error_nom
54a0: 65 6d 28 63 6f 6e 74 65 78 74 29 3b 0a 20 20 20  em(context);.   
54b0: 20 20 20 72 65 74 75 72 6e 3b 0a 20 20 20 20 7d     return;.    }
54c0: 0a 20 20 20 20 73 71 6c 69 74 65 33 5f 73 65 74  .    sqlite3_set
54d0: 5f 61 75 78 64 61 74 61 28 63 6f 6e 74 65 78 74  _auxdata(context
54e0: 2c 20 30 2c 20 70 52 65 2c 20 28 76 6f 69 64 28  , 0, pRe, (void(
54f0: 2a 29 28 76 6f 69 64 2a 29 29 72 65 5f 66 72 65  *)(void*))re_fre
5500: 65 29 3b 0a 20 20 7d 0a 20 20 7a 53 74 72 20 3d  e);.  }.  zStr =
5510: 20 28 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64   (const unsigned
5520: 20 63 68 61 72 2a 29 73 71 6c 69 74 65 33 5f 76   char*)sqlite3_v
5530: 61 6c 75 65 5f 74 65 78 74 28 61 72 67 76 5b 31  alue_text(argv[1
5540: 5d 29 3b 0a 20 20 69 66 28 20 7a 53 74 72 21 3d  ]);.  if( zStr!=
5550: 30 20 29 7b 0a 20 20 20 20 73 71 6c 69 74 65 33  0 ){.    sqlite3
5560: 5f 72 65 73 75 6c 74 5f 69 6e 74 28 63 6f 6e 74  _result_int(cont
5570: 65 78 74 2c 20 72 65 5f 6d 61 74 63 68 28 70 52  ext, re_match(pR
5580: 65 2c 20 7a 53 74 72 2c 20 2d 31 29 29 3b 0a 20  e, zStr, -1));. 
5590: 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 49 6e 76 6f   }.}../*.** Invo
55a0: 6b 65 20 74 68 69 73 20 72 6f 75 74 69 6e 65 20  ke this routine 
55b0: 69 6e 20 6f 72 64 65 72 20 74 6f 20 69 6e 73 74  in order to inst
55c0: 61 6c 6c 20 74 68 65 20 52 45 47 45 58 50 20 66  all the REGEXP f
55d0: 75 6e 63 74 69 6f 6e 20 69 6e 20 61 6e 0a 2a 2a  unction in an.**
55e0: 20 53 51 4c 69 74 65 20 64 61 74 61 62 61 73 65   SQLite database
55f0: 20 63 6f 6e 6e 65 63 74 69 6f 6e 2e 0a 2a 2a 0a   connection..**.
5600: 2a 2a 20 55 73 65 3a 0a 2a 2a 0a 2a 2a 20 20 20  ** Use:.**.**   
5610: 20 20 20 73 71 6c 69 74 65 33 5f 61 75 74 6f 5f     sqlite3_auto_
5620: 65 78 74 65 6e 73 69 6f 6e 28 73 71 6c 69 74 65  extension(sqlite
5630: 33 5f 61 64 64 5f 72 65 67 65 78 70 5f 66 75 6e  3_add_regexp_fun
5640: 63 29 3b 0a 2a 2a 0a 2a 2a 20 74 6f 20 63 61 75  c);.**.** to cau
5650: 73 65 20 74 68 69 73 20 65 78 74 65 6e 73 69 6f  se this extensio
5660: 6e 20 74 6f 20 62 65 20 61 75 74 6f 6d 61 74 69  n to be automati
5670: 63 61 6c 6c 79 20 6c 6f 61 64 65 64 20 69 6e 74  cally loaded int
5680: 6f 20 65 61 63 68 20 6e 65 77 0a 2a 2a 20 64 61  o each new.** da
5690: 74 61 62 61 73 65 20 63 6f 6e 6e 65 63 74 69 6f  tabase connectio
56a0: 6e 2e 0a 2a 2f 0a 69 6e 74 20 73 71 6c 69 74 65  n..*/.int sqlite
56b0: 33 5f 61 64 64 5f 72 65 67 65 78 70 5f 66 75 6e  3_add_regexp_fun
56c0: 63 28 73 71 6c 69 74 65 33 20 2a 64 62 29 7b 0a  c(sqlite3 *db){.
56d0: 20 20 72 65 74 75 72 6e 20 73 71 6c 69 74 65 33    return sqlite3
56e0: 5f 63 72 65 61 74 65 5f 66 75 6e 63 74 69 6f 6e  _create_function
56f0: 28 64 62 2c 20 22 72 65 67 65 78 70 22 2c 20 32  (db, "regexp", 2
5700: 2c 20 53 51 4c 49 54 45 5f 55 54 46 38 2c 20 30  , SQLITE_UTF8, 0
5710: 2c 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ,.              
5720: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
5730: 20 20 20 72 65 5f 73 71 6c 5f 66 75 6e 63 2c 20     re_sql_func, 
5740: 30 2c 20 30 29 3b 0a 7d 0a 0a 0a 2f 2a 2a 2a 2a  0, 0);.}.../****
5750: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
5760: 2a 2a 2a 2a 2a 2a 2a 2a 2a 20 54 65 73 74 20 43  ********* Test C
5770: 6f 64 65 20 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ode ************
5780: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
5790: 2a 2a 2a 2a 2a 2a 2a 2f 0a 23 69 66 64 65 66 20  *******/.#ifdef 
57a0: 53 51 4c 49 54 45 5f 54 45 53 54 0a 23 69 6e 63  SQLITE_TEST.#inc
57b0: 6c 75 64 65 20 3c 74 63 6c 2e 68 3e 0a 65 78 74  lude <tcl.h>.ext
57c0: 65 72 6e 20 69 6e 74 20 67 65 74 44 62 50 6f 69  ern int getDbPoi
57d0: 6e 74 65 72 28 54 63 6c 5f 49 6e 74 65 72 70 20  nter(Tcl_Interp 
57e0: 2a 69 6e 74 65 72 70 2c 20 63 6f 6e 73 74 20 63  *interp, const c
57f0: 68 61 72 20 2a 7a 41 2c 20 73 71 6c 69 74 65 33  har *zA, sqlite3
5800: 20 2a 2a 70 70 44 62 29 3b 0a 0a 2f 2a 20 49 6d   **ppDb);../* Im
5810: 70 6c 65 6d 65 6e 74 61 74 69 6f 6e 20 6f 66 20  plementation of 
5820: 74 68 65 20 54 43 4c 20 63 6f 6d 6d 61 6e 64 3a  the TCL command:
5830: 0a 2a 2a 0a 2a 2a 20 20 20 20 20 20 73 71 6c 69  .**.**      sqli
5840: 74 65 33 5f 61 64 64 5f 72 65 67 65 78 70 5f 66  te3_add_regexp_f
5850: 75 6e 63 20 24 44 42 0a 2a 2f 0a 73 74 61 74 69  unc $DB.*/.stati
5860: 63 20 69 6e 74 20 74 63 6c 53 71 6c 69 74 65 33  c int tclSqlite3
5870: 41 64 64 52 65 67 65 78 70 46 75 6e 63 28 0a 20  AddRegexpFunc(. 
5880: 20 76 6f 69 64 20 2a 20 63 6c 69 65 6e 74 44 61   void * clientDa
5890: 74 61 2c 0a 20 20 54 63 6c 5f 49 6e 74 65 72 70  ta,.  Tcl_Interp
58a0: 20 2a 69 6e 74 65 72 70 2c 0a 20 20 69 6e 74 20   *interp,.  int 
58b0: 6f 62 6a 63 2c 0a 20 20 54 63 6c 5f 4f 62 6a 20  objc,.  Tcl_Obj 
58c0: 2a 43 4f 4e 53 54 20 6f 62 6a 76 5b 5d 0a 29 7b  *CONST objv[].){
58d0: 0a 20 20 73 71 6c 69 74 65 33 20 2a 64 62 3b 0a  .  sqlite3 *db;.
58e0: 20 20 69 66 28 20 6f 62 6a 63 21 3d 32 20 29 7b    if( objc!=2 ){
58f0: 0a 20 20 20 20 54 63 6c 5f 57 72 6f 6e 67 4e 75  .    Tcl_WrongNu
5900: 6d 41 72 67 73 28 69 6e 74 65 72 70 2c 20 31 2c  mArgs(interp, 1,
5910: 20 6f 62 6a 76 2c 20 22 44 42 22 29 3b 0a 20 20   objv, "DB");.  
5920: 20 20 72 65 74 75 72 6e 20 54 43 4c 5f 45 52 52    return TCL_ERR
5930: 4f 52 3b 0a 20 20 7d 0a 20 20 69 66 28 20 67 65  OR;.  }.  if( ge
5940: 74 44 62 50 6f 69 6e 74 65 72 28 69 6e 74 65 72  tDbPointer(inter
5950: 70 2c 20 54 63 6c 5f 47 65 74 53 74 72 69 6e 67  p, Tcl_GetString
5960: 28 6f 62 6a 76 5b 31 5d 29 2c 20 26 64 62 29 20  (objv[1]), &db) 
5970: 29 20 72 65 74 75 72 6e 20 54 43 4c 5f 45 52 52  ) return TCL_ERR
5980: 4f 52 3b 0a 20 20 73 71 6c 69 74 65 33 5f 61 64  OR;.  sqlite3_ad
5990: 64 5f 72 65 67 65 78 70 5f 66 75 6e 63 28 64 62  d_regexp_func(db
59a0: 29 3b 0a 20 20 72 65 74 75 72 6e 20 54 43 4c 5f  );.  return TCL_
59b0: 4f 4b 3b 0a 7d 0a 0a 2f 2a 20 52 65 67 69 73 74  OK;.}../* Regist
59c0: 65 72 20 74 68 65 20 73 71 6c 69 74 65 33 5f 61  er the sqlite3_a
59d0: 64 64 5f 72 65 67 65 78 70 5f 66 75 6e 63 20 54  dd_regexp_func T
59e0: 43 4c 20 63 6f 6d 6d 61 6e 64 20 77 69 74 68 20  CL command with 
59f0: 74 68 65 20 54 43 4c 20 69 6e 74 65 72 70 72 65  the TCL interpre
5a00: 74 65 72 2e 0a 2a 2f 0a 69 6e 74 20 53 71 6c 69  ter..*/.int Sqli
5a10: 74 65 74 65 73 74 72 65 67 65 78 70 5f 49 6e 69  tetestregexp_Ini
5a20: 74 28 54 63 6c 5f 49 6e 74 65 72 70 20 2a 69 6e  t(Tcl_Interp *in
5a30: 74 65 72 70 29 7b 0a 20 20 54 63 6c 5f 43 72 65  terp){.  Tcl_Cre
5a40: 61 74 65 4f 62 6a 43 6f 6d 6d 61 6e 64 28 69 6e  ateObjCommand(in
5a50: 74 65 72 70 2c 20 22 73 71 6c 69 74 65 33 5f 61  terp, "sqlite3_a
5a60: 64 64 5f 72 65 67 65 78 70 5f 66 75 6e 63 22 2c  dd_regexp_func",
5a70: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
5a80: 20 20 20 20 20 20 20 20 74 63 6c 53 71 6c 69 74          tclSqlit
5a90: 65 33 41 64 64 52 65 67 65 78 70 46 75 6e 63 2c  e3AddRegexpFunc,
5aa0: 20 30 2c 20 30 29 3b 0a 20 20 72 65 74 75 72 6e   0, 0);.  return
5ab0: 20 54 43 4c 5f 4f 4b 3b 0a 7d 0a 23 65 6e 64 69   TCL_OK;.}.#endi
5ac0: 66 20 2f 2a 20 53 51 4c 49 54 45 5f 54 45 53 54  f /* SQLITE_TEST
5ad0: 20 2a 2f 0a 2f 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a   */./***********
5ae0: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
5af0: 2a 20 45 6e 64 20 4f 66 20 54 65 73 74 20 43 6f  * End Of Test Co
5b00: 64 65 20 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  de *************
5b10: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
5b20: 2a 2a 2f 0a                                      **/.