/ Hex Artifact Content
Login

Artifact 73134f4d3e44686ef5abd877f4fb1290b75f3311:


0000: 2f 2a 0a 2a 2a 20 32 30 30 34 20 41 70 72 69 6c  /*.** 2004 April
0010: 20 31 33 0a 2a 2a 0a 2a 2a 20 54 68 65 20 61 75   13.**.** The au
0020: 74 68 6f 72 20 64 69 73 63 6c 61 69 6d 73 20 63  thor disclaims c
0030: 6f 70 79 72 69 67 68 74 20 74 6f 20 74 68 69 73  opyright to this
0040: 20 73 6f 75 72 63 65 20 63 6f 64 65 2e 20 20 49   source code.  I
0050: 6e 20 70 6c 61 63 65 20 6f 66 0a 2a 2a 20 61 20  n place of.** a 
0060: 6c 65 67 61 6c 20 6e 6f 74 69 63 65 2c 20 68 65  legal notice, he
0070: 72 65 20 69 73 20 61 20 62 6c 65 73 73 69 6e 67  re is a blessing
0080: 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 4d 61 79 20 79  :.**.**    May y
0090: 6f 75 20 64 6f 20 67 6f 6f 64 20 61 6e 64 20 6e  ou do good and n
00a0: 6f 74 20 65 76 69 6c 2e 0a 2a 2a 20 20 20 20 4d  ot evil..**    M
00b0: 61 79 20 79 6f 75 20 66 69 6e 64 20 66 6f 72 67  ay you find forg
00c0: 69 76 65 6e 65 73 73 20 66 6f 72 20 79 6f 75 72  iveness for your
00d0: 73 65 6c 66 20 61 6e 64 20 66 6f 72 67 69 76 65  self and forgive
00e0: 20 6f 74 68 65 72 73 2e 0a 2a 2a 20 20 20 20 4d   others..**    M
00f0: 61 79 20 79 6f 75 20 73 68 61 72 65 20 66 72 65  ay you share fre
0100: 65 6c 79 2c 20 6e 65 76 65 72 20 74 61 6b 69 6e  ely, never takin
0110: 67 20 6d 6f 72 65 20 74 68 61 6e 20 79 6f 75 20  g more than you 
0120: 67 69 76 65 2e 0a 2a 2a 0a 2a 2a 2a 2a 2a 2a 2a  give..**.*******
0130: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0140: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0150: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0160: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0170: 2a 2a 0a 2a 2a 20 54 68 69 73 20 66 69 6c 65 20  **.** This file 
0180: 63 6f 6e 74 61 69 6e 73 20 72 6f 75 74 69 6e 65  contains routine
0190: 73 20 75 73 65 64 20 74 6f 20 74 72 61 6e 73 6c  s used to transl
01a0: 61 74 65 20 62 65 74 77 65 65 6e 20 55 54 46 2d  ate between UTF-
01b0: 38 2c 20 0a 2a 2a 20 55 54 46 2d 31 36 2c 20 55  8, .** UTF-16, U
01c0: 54 46 2d 31 36 42 45 2c 20 61 6e 64 20 55 54 46  TF-16BE, and UTF
01d0: 2d 31 36 4c 45 2e 0a 2a 2a 0a 2a 2a 20 24 49 64  -16LE..**.** $Id
01e0: 3a 20 75 74 66 2e 63 2c 76 20 31 2e 35 30 20 32  : utf.c,v 1.50 2
01f0: 30 30 37 2f 30 35 2f 31 36 20 31 38 3a 32 33 3a  007/05/16 18:23:
0200: 30 35 20 64 61 6e 69 65 6c 6b 31 39 37 37 20 45  05 danielk1977 E
0210: 78 70 20 24 0a 2a 2a 0a 2a 2a 20 4e 6f 74 65 73  xp $.**.** Notes
0220: 20 6f 6e 20 55 54 46 2d 38 3a 0a 2a 2a 0a 2a 2a   on UTF-8:.**.**
0230: 20 20 20 42 79 74 65 2d 30 20 20 20 20 42 79 74     Byte-0    Byt
0240: 65 2d 31 20 20 20 20 42 79 74 65 2d 32 20 20 20  e-1    Byte-2   
0250: 20 42 79 74 65 2d 33 20 20 20 20 56 61 6c 75 65   Byte-3    Value
0260: 0a 2a 2a 20 20 30 78 78 78 78 78 78 78 20 20 20  .**  0xxxxxxx   
0270: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0280: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 30 30                00
0290: 30 30 30 30 30 30 20 30 30 30 30 30 30 30 30 20  000000 00000000 
02a0: 30 78 78 78 78 78 78 78 0a 2a 2a 20 20 31 31 30  0xxxxxxx.**  110
02b0: 79 79 79 79 79 20 20 31 30 78 78 78 78 78 78 20  yyyyy  10xxxxxx 
02c0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
02d0: 20 20 20 20 20 20 30 30 30 30 30 30 30 30 20 30        00000000 0
02e0: 30 30 30 30 79 79 79 20 79 79 78 78 78 78 78 78  0000yyy yyxxxxxx
02f0: 0a 2a 2a 20 20 31 31 31 30 7a 7a 7a 7a 20 20 31  .**  1110zzzz  1
0300: 30 79 79 79 79 79 79 20 20 31 30 78 78 78 78 78  0yyyyyy  10xxxxx
0310: 78 20 20 20 20 20 20 20 20 20 20 20 20 20 30 30  x             00
0320: 30 30 30 30 30 30 20 7a 7a 7a 7a 79 79 79 79 20  000000 zzzzyyyy 
0330: 79 79 78 78 78 78 78 78 0a 2a 2a 20 20 31 31 31  yyxxxxxx.**  111
0340: 31 30 75 75 75 20 20 31 30 75 75 7a 7a 7a 7a 20  10uuu  10uuzzzz 
0350: 20 31 30 79 79 79 79 79 79 20 20 31 30 78 78 78   10yyyyyy  10xxx
0360: 78 78 78 20 20 20 30 30 30 75 75 75 75 75 20 7a  xxx   000uuuuu z
0370: 7a 7a 7a 79 79 79 79 20 79 79 78 78 78 78 78 78  zzzyyyy yyxxxxxx
0380: 0a 2a 2a 0a 2a 2a 0a 2a 2a 20 4e 6f 74 65 73 20  .**.**.** Notes 
0390: 6f 6e 20 55 54 46 2d 31 36 3a 20 20 28 77 69 74  on UTF-16:  (wit
03a0: 68 20 77 77 77 77 2b 31 3d 3d 75 75 75 75 75 29  h wwww+1==uuuuu)
03b0: 0a 2a 2a 0a 2a 2a 20 20 20 20 20 20 57 6f 72 64  .**.**      Word
03c0: 2d 30 20 20 20 20 20 20 20 20 20 20 20 20 20 20  -0              
03d0: 20 57 6f 72 64 2d 31 20 20 20 20 20 20 20 20 20   Word-1         
03e0: 20 56 61 6c 75 65 0a 2a 2a 20 20 31 31 30 31 31   Value.**  11011
03f0: 30 77 77 20 77 77 7a 7a 7a 7a 79 79 20 20 20 31  0ww wwzzzzyy   1
0400: 31 30 31 31 31 79 79 20 79 79 78 78 78 78 78 78  10111yy yyxxxxxx
0410: 20 20 20 20 30 30 30 75 75 75 75 75 20 7a 7a 7a      000uuuuu zzz
0420: 7a 79 79 79 79 20 79 79 78 78 78 78 78 78 0a 2a  zyyyy yyxxxxxx.*
0430: 2a 20 20 7a 7a 7a 7a 79 79 79 79 20 79 79 78 78  *  zzzzyyyy yyxx
0440: 78 78 78 78 20 20 20 20 20 20 20 20 20 20 20 20  xxxx            
0450: 20 20 20 20 20 20 20 20 20 20 20 20 30 30 30 30              0000
0460: 30 30 30 30 20 7a 7a 7a 7a 79 79 79 79 20 79 79  0000 zzzzyyyy yy
0470: 78 78 78 78 78 78 0a 2a 2a 0a 2a 2a 0a 2a 2a 20  xxxxxx.**.**.** 
0480: 42 4f 4d 20 6f 72 20 42 79 74 65 20 4f 72 64 65  BOM or Byte Orde
0490: 72 20 4d 61 72 6b 3a 0a 2a 2a 20 20 20 20 20 30  r Mark:.**     0
04a0: 78 66 66 20 30 78 66 65 20 20 20 6c 69 74 74 6c  xff 0xfe   littl
04b0: 65 2d 65 6e 64 69 61 6e 20 75 74 66 2d 31 36 20  e-endian utf-16 
04c0: 66 6f 6c 6c 6f 77 73 0a 2a 2a 20 20 20 20 20 30  follows.**     0
04d0: 78 66 65 20 30 78 66 66 20 20 20 62 69 67 2d 65  xfe 0xff   big-e
04e0: 6e 64 69 61 6e 20 75 74 66 2d 31 36 20 66 6f 6c  ndian utf-16 fol
04f0: 6c 6f 77 73 0a 2a 2a 0a 2a 2f 0a 23 69 6e 63 6c  lows.**.*/.#incl
0500: 75 64 65 20 22 73 71 6c 69 74 65 49 6e 74 2e 68  ude "sqliteInt.h
0510: 22 0a 23 69 6e 63 6c 75 64 65 20 3c 61 73 73 65  ".#include <asse
0520: 72 74 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 22  rt.h>.#include "
0530: 76 64 62 65 49 6e 74 2e 68 22 0a 0a 2f 2a 0a 2a  vdbeInt.h"../*.*
0540: 2a 20 54 68 65 20 66 6f 6c 6c 6f 77 69 6e 67 20  * The following 
0550: 63 6f 6e 73 74 61 6e 74 20 76 61 6c 75 65 20 69  constant value i
0560: 73 20 75 73 65 64 20 62 79 20 74 68 65 20 53 51  s used by the SQ
0570: 4c 49 54 45 5f 42 49 47 45 4e 44 49 41 4e 20 61  LITE_BIGENDIAN a
0580: 6e 64 0a 2a 2a 20 53 51 4c 49 54 45 5f 4c 49 54  nd.** SQLITE_LIT
0590: 54 4c 45 45 4e 44 49 41 4e 20 6d 61 63 72 6f 73  TLEENDIAN macros
05a0: 2e 0a 2a 2f 0a 63 6f 6e 73 74 20 69 6e 74 20 73  ..*/.const int s
05b0: 71 6c 69 74 65 33 6f 6e 65 20 3d 20 31 3b 0a 0a  qlite3one = 1;..
05c0: 2f 2a 0a 2a 2a 20 54 68 69 73 20 6c 6f 6f 6b 75  /*.** This looku
05d0: 70 20 74 61 62 6c 65 20 69 73 20 75 73 65 64 20  p table is used 
05e0: 74 6f 20 68 65 6c 70 20 64 65 63 6f 64 65 20 74  to help decode t
05f0: 68 65 20 66 69 72 73 74 20 62 79 74 65 20 6f 66  he first byte of
0600: 0a 2a 2a 20 61 20 6d 75 6c 74 69 2d 62 79 74 65  .** a multi-byte
0610: 20 55 54 46 38 20 63 68 61 72 61 63 74 65 72 2e   UTF8 character.
0620: 0a 2a 2f 0a 63 6f 6e 73 74 20 75 6e 73 69 67 6e  .*/.const unsign
0630: 65 64 20 63 68 61 72 20 73 71 6c 69 74 65 33 55  ed char sqlite3U
0640: 74 66 54 72 61 6e 73 31 5b 5d 20 3d 20 7b 0a 20  tfTrans1[] = {. 
0650: 20 30 78 30 30 2c 20 30 78 30 31 2c 20 30 78 30   0x00, 0x01, 0x0
0660: 32 2c 20 30 78 30 33 2c 20 30 78 30 34 2c 20 30  2, 0x03, 0x04, 0
0670: 78 30 35 2c 20 30 78 30 36 2c 20 30 78 30 37 2c  x05, 0x06, 0x07,
0680: 0a 20 20 30 78 30 38 2c 20 30 78 30 39 2c 20 30  .  0x08, 0x09, 0
0690: 78 30 61 2c 20 30 78 30 62 2c 20 30 78 30 63 2c  x0a, 0x0b, 0x0c,
06a0: 20 30 78 30 64 2c 20 30 78 30 65 2c 20 30 78 30   0x0d, 0x0e, 0x0
06b0: 66 2c 0a 20 20 30 78 31 30 2c 20 30 78 31 31 2c  f,.  0x10, 0x11,
06c0: 20 30 78 31 32 2c 20 30 78 31 33 2c 20 30 78 31   0x12, 0x13, 0x1
06d0: 34 2c 20 30 78 31 35 2c 20 30 78 31 36 2c 20 30  4, 0x15, 0x16, 0
06e0: 78 31 37 2c 0a 20 20 30 78 31 38 2c 20 30 78 31  x17,.  0x18, 0x1
06f0: 39 2c 20 30 78 31 61 2c 20 30 78 31 62 2c 20 30  9, 0x1a, 0x1b, 0
0700: 78 31 63 2c 20 30 78 31 64 2c 20 30 78 31 65 2c  x1c, 0x1d, 0x1e,
0710: 20 30 78 31 66 2c 0a 20 20 30 78 30 30 2c 20 30   0x1f,.  0x00, 0
0720: 78 30 31 2c 20 30 78 30 32 2c 20 30 78 30 33 2c  x01, 0x02, 0x03,
0730: 20 30 78 30 34 2c 20 30 78 30 35 2c 20 30 78 30   0x04, 0x05, 0x0
0740: 36 2c 20 30 78 30 37 2c 0a 20 20 30 78 30 38 2c  6, 0x07,.  0x08,
0750: 20 30 78 30 39 2c 20 30 78 30 61 2c 20 30 78 30   0x09, 0x0a, 0x0
0760: 62 2c 20 30 78 30 63 2c 20 30 78 30 64 2c 20 30  b, 0x0c, 0x0d, 0
0770: 78 30 65 2c 20 30 78 30 66 2c 0a 20 20 30 78 30  x0e, 0x0f,.  0x0
0780: 30 2c 20 30 78 30 31 2c 20 30 78 30 32 2c 20 30  0, 0x01, 0x02, 0
0790: 78 30 33 2c 20 30 78 30 34 2c 20 30 78 30 35 2c  x03, 0x04, 0x05,
07a0: 20 30 78 30 36 2c 20 30 78 30 37 2c 0a 20 20 30   0x06, 0x07,.  0
07b0: 78 30 30 2c 20 30 78 30 31 2c 20 30 78 30 32 2c  x00, 0x01, 0x02,
07c0: 20 30 78 30 33 2c 20 30 78 30 30 2c 20 30 78 30   0x03, 0x00, 0x0
07d0: 31 2c 20 30 78 30 30 2c 20 30 78 30 30 2c 0a 7d  1, 0x00, 0x00,.}
07e0: 3b 0a 0a 23 64 65 66 69 6e 65 20 57 52 49 54 45  ;..#define WRITE
07f0: 5f 55 54 46 38 28 7a 4f 75 74 2c 20 63 29 20 7b  _UTF8(zOut, c) {
0800: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0810: 20 20 20 20 20 20 20 20 20 20 5c 0a 20 20 69 66            \.  if
0820: 28 20 63 3c 30 78 30 30 30 38 30 20 29 7b 20 20  ( c<0x00080 ){  
0830: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0840: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0850: 20 20 20 5c 0a 20 20 20 20 2a 7a 4f 75 74 2b 2b     \.    *zOut++
0860: 20 3d 20 28 63 26 30 78 46 46 29 3b 20 20 20 20   = (c&0xFF);    
0870: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0880: 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20 20              \.  
0890: 7d 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  }               
08a0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
08b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
08c0: 20 20 20 20 20 5c 0a 20 20 65 6c 73 65 20 69 66       \.  else if
08d0: 28 20 63 3c 30 78 30 30 38 30 30 20 29 7b 20 20  ( c<0x00800 ){  
08e0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
08f0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a                \.
0900: 20 20 20 20 2a 7a 4f 75 74 2b 2b 20 3d 20 30 78      *zOut++ = 0x
0910: 43 30 20 2b 20 28 28 63 3e 3e 36 29 26 30 78 31  C0 + ((c>>6)&0x1
0920: 46 29 3b 20 20 20 20 20 20 20 20 20 20 20 20 20  F);             
0930: 20 20 20 20 20 20 20 5c 0a 20 20 20 20 2a 7a 4f         \.    *zO
0940: 75 74 2b 2b 20 3d 20 30 78 38 30 20 2b 20 28 63  ut++ = 0x80 + (c
0950: 20 26 20 30 78 33 46 29 3b 20 20 20 20 20 20 20   & 0x3F);       
0960: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0970: 5c 0a 20 20 7d 20 20 20 20 20 20 20 20 20 20 20  \.  }           
0980: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0990: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
09a0: 20 20 20 20 20 20 20 20 20 5c 0a 20 20 65 6c 73           \.  els
09b0: 65 20 69 66 28 20 63 3c 30 78 31 30 30 30 30 20  e if( c<0x10000 
09c0: 29 7b 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ){              
09d0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
09e0: 20 20 5c 0a 20 20 20 20 2a 7a 4f 75 74 2b 2b 20    \.    *zOut++ 
09f0: 3d 20 30 78 45 30 20 2b 20 28 28 63 3e 3e 31 32  = 0xE0 + ((c>>12
0a00: 29 26 30 78 30 46 29 3b 20 20 20 20 20 20 20 20  )&0x0F);        
0a10: 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20 20 20             \.   
0a20: 20 2a 7a 4f 75 74 2b 2b 20 3d 20 30 78 38 30 20   *zOut++ = 0x80 
0a30: 2b 20 28 28 63 3e 3e 36 29 20 26 20 30 78 33 46  + ((c>>6) & 0x3F
0a40: 29 3b 20 20 20 20 20 20 20 20 20 20 20 20 20 20  );              
0a50: 20 20 20 20 5c 0a 20 20 20 20 2a 7a 4f 75 74 2b      \.    *zOut+
0a60: 2b 20 3d 20 30 78 38 30 20 2b 20 28 63 20 26 20  + = 0x80 + (c & 
0a70: 30 78 33 46 29 3b 20 20 20 20 20 20 20 20 20 20  0x3F);          
0a80: 20 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20               \. 
0a90: 20 7d 65 6c 73 65 7b 20 20 20 20 20 20 20 20 20   }else{         
0aa0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0ab0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0ac0: 20 20 20 20 20 20 5c 0a 20 20 20 20 2a 7a 4f 75        \.    *zOu
0ad0: 74 2b 2b 20 3d 20 30 78 46 30 20 2b 20 28 28 63  t++ = 0xF0 + ((c
0ae0: 3e 3e 31 38 29 20 26 20 30 78 30 37 29 3b 20 20  >>18) & 0x07);  
0af0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 5c                 \
0b00: 0a 20 20 20 20 2a 7a 4f 75 74 2b 2b 20 3d 20 30  .    *zOut++ = 0
0b10: 78 38 30 20 2b 20 28 28 63 3e 3e 31 32 29 20 26  x80 + ((c>>12) &
0b20: 20 30 78 33 46 29 3b 20 20 20 20 20 20 20 20 20   0x3F);         
0b30: 20 20 20 20 20 20 20 20 5c 0a 20 20 20 20 2a 7a          \.    *z
0b40: 4f 75 74 2b 2b 20 3d 20 30 78 38 30 20 2b 20 28  Out++ = 0x80 + (
0b50: 28 63 3e 3e 36 29 20 26 20 30 78 33 46 29 3b 20  (c>>6) & 0x3F); 
0b60: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0b70: 20 5c 0a 20 20 20 20 2a 7a 4f 75 74 2b 2b 20 3d   \.    *zOut++ =
0b80: 20 30 78 38 30 20 2b 20 28 63 20 26 20 30 78 33   0x80 + (c & 0x3
0b90: 46 29 3b 20 20 20 20 20 20 20 20 20 20 20 20 20  F);             
0ba0: 20 20 20 20 20 20 20 20 20 20 5c 0a 20 20 7d 20            \.  } 
0bb0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0bc0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0bd0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0be0: 20 20 20 5c 0a 7d 0a 0a 23 64 65 66 69 6e 65 20     \.}..#define 
0bf0: 57 52 49 54 45 5f 55 54 46 31 36 4c 45 28 7a 4f  WRITE_UTF16LE(zO
0c00: 75 74 2c 20 63 29 20 7b 20 20 20 20 20 20 20 20  ut, c) {        
0c10: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0c20: 20 20 20 20 20 20 20 20 5c 0a 20 20 69 66 28 20          \.  if( 
0c30: 63 3c 3d 30 78 46 46 46 46 20 29 7b 20 20 20 20  c<=0xFFFF ){    
0c40: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0c50: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0c60: 20 20 20 20 20 20 20 20 20 20 5c 0a 20 20 20 20            \.    
0c70: 2a 7a 4f 75 74 2b 2b 20 3d 20 28 63 26 30 78 30  *zOut++ = (c&0x0
0c80: 30 46 46 29 3b 20 20 20 20 20 20 20 20 20 20 20  0FF);           
0c90: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0ca0: 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20 20              \.  
0cb0: 20 20 2a 7a 4f 75 74 2b 2b 20 3d 20 28 28 63 3e    *zOut++ = ((c>
0cc0: 3e 38 29 26 30 78 30 30 46 46 29 3b 20 20 20 20  >8)&0x00FF);    
0cd0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0ce0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a                \.
0cf0: 20 20 7d 65 6c 73 65 7b 20 20 20 20 20 20 20 20    }else{        
0d00: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0d10: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0d20: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0d30: 5c 0a 20 20 20 20 2a 7a 4f 75 74 2b 2b 20 3d 20  \.    *zOut++ = 
0d40: 28 28 28 63 3e 3e 31 30 29 26 30 78 30 30 33 46  (((c>>10)&0x003F
0d50: 29 20 2b 20 28 28 28 63 2d 30 78 31 30 30 30 30  ) + (((c-0x10000
0d60: 29 3e 3e 31 30 29 26 30 78 30 30 43 30 29 29 3b  )>>10)&0x00C0));
0d70: 20 20 5c 0a 20 20 20 20 2a 7a 4f 75 74 2b 2b 20    \.    *zOut++ 
0d80: 3d 20 28 30 78 30 30 44 38 20 2b 20 28 28 28 63  = (0x00D8 + (((c
0d90: 2d 30 78 31 30 30 30 30 29 3e 3e 31 38 29 26 30  -0x10000)>>18)&0
0da0: 78 30 33 29 29 3b 20 20 20 20 20 20 20 20 20 20  x03));          
0db0: 20 20 20 20 5c 0a 20 20 20 20 2a 7a 4f 75 74 2b      \.    *zOut+
0dc0: 2b 20 3d 20 28 63 26 30 78 30 30 46 46 29 3b 20  + = (c&0x00FF); 
0dd0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0de0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0df0: 20 20 20 20 20 20 5c 0a 20 20 20 20 2a 7a 4f 75        \.    *zOu
0e00: 74 2b 2b 20 3d 20 28 30 78 30 30 44 43 20 2b 20  t++ = (0x00DC + 
0e10: 28 28 63 3e 3e 38 29 26 30 78 30 33 29 29 3b 20  ((c>>8)&0x03)); 
0e20: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0e30: 20 20 20 20 20 20 20 20 5c 0a 20 20 7d 20 20 20          \.  }   
0e40: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0e50: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0e60: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0e70: 20 20 20 20 20 20 20 20 20 20 5c 0a 7d 0a 0a 23            \.}..#
0e80: 64 65 66 69 6e 65 20 57 52 49 54 45 5f 55 54 46  define WRITE_UTF
0e90: 31 36 42 45 28 7a 4f 75 74 2c 20 63 29 20 7b 20  16BE(zOut, c) { 
0ea0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0eb0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 5c                 \
0ec0: 0a 20 20 69 66 28 20 63 3c 3d 30 78 46 46 46 46  .  if( c<=0xFFFF
0ed0: 20 29 7b 20 20 20 20 20 20 20 20 20 20 20 20 20   ){             
0ee0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0ef0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0f00: 20 5c 0a 20 20 20 20 2a 7a 4f 75 74 2b 2b 20 3d   \.    *zOut++ =
0f10: 20 28 28 63 3e 3e 38 29 26 30 78 30 30 46 46 29   ((c>>8)&0x00FF)
0f20: 3b 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ;               
0f30: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0f40: 20 20 20 5c 0a 20 20 20 20 2a 7a 4f 75 74 2b 2b     \.    *zOut++
0f50: 20 3d 20 28 63 26 30 78 30 30 46 46 29 3b 20 20   = (c&0x00FF);  
0f60: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0f70: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0f80: 20 20 20 20 20 5c 0a 20 20 7d 65 6c 73 65 7b 20       \.  }else{ 
0f90: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0fa0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0fb0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0fc0: 20 20 20 20 20 20 20 5c 0a 20 20 20 20 2a 7a 4f         \.    *zO
0fd0: 75 74 2b 2b 20 3d 20 28 30 78 30 30 44 38 20 2b  ut++ = (0x00D8 +
0fe0: 20 28 28 28 63 2d 30 78 31 30 30 30 30 29 3e 3e   (((c-0x10000)>>
0ff0: 31 38 29 26 30 78 30 33 29 29 3b 20 20 20 20 20  18)&0x03));     
1000: 20 20 20 20 20 20 20 20 20 5c 0a 20 20 20 20 2a           \.    *
1010: 7a 4f 75 74 2b 2b 20 3d 20 28 28 28 63 3e 3e 31  zOut++ = (((c>>1
1020: 30 29 26 30 78 30 30 33 46 29 20 2b 20 28 28 28  0)&0x003F) + (((
1030: 63 2d 30 78 31 30 30 30 30 29 3e 3e 31 30 29 26  c-0x10000)>>10)&
1040: 30 78 30 30 43 30 29 29 3b 20 20 5c 0a 20 20 20  0x00C0));  \.   
1050: 20 2a 7a 4f 75 74 2b 2b 20 3d 20 28 30 78 30 30   *zOut++ = (0x00
1060: 44 43 20 2b 20 28 28 63 3e 3e 38 29 26 30 78 30  DC + ((c>>8)&0x0
1070: 33 29 29 3b 20 20 20 20 20 20 20 20 20 20 20 20  3));            
1080: 20 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20               \. 
1090: 20 20 20 2a 7a 4f 75 74 2b 2b 20 3d 20 28 63 26     *zOut++ = (c&
10a0: 30 78 30 30 46 46 29 3b 20 20 20 20 20 20 20 20  0x00FF);        
10b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
10c0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 5c                 \
10d0: 0a 20 20 7d 20 20 20 20 20 20 20 20 20 20 20 20  .  }            
10e0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
10f0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1100: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1110: 20 5c 0a 7d 0a 0a 23 64 65 66 69 6e 65 20 52 45   \.}..#define RE
1120: 41 44 5f 55 54 46 31 36 4c 45 28 7a 49 6e 2c 20  AD_UTF16LE(zIn, 
1130: 63 29 7b 20 20 20 20 20 20 20 20 20 20 20 20 20  c){             
1140: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1150: 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20 20              \.  
1160: 63 20 3d 20 28 2a 7a 49 6e 2b 2b 29 3b 20 20 20  c = (*zIn++);   
1170: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1180: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1190: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
11a0: 20 20 20 20 5c 0a 20 20 63 20 2b 3d 20 28 28 2a      \.  c += ((*
11b0: 7a 49 6e 2b 2b 29 3c 3c 38 29 3b 20 20 20 20 20  zIn++)<<8);     
11c0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
11d0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
11e0: 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20 20              \.  
11f0: 69 66 28 20 63 3e 3d 30 78 44 38 30 30 20 26 26  if( c>=0xD800 &&
1200: 20 63 3c 30 78 45 30 30 30 20 29 7b 20 20 20 20   c<0xE000 ){    
1210: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1220: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1230: 20 20 20 5c 0a 20 20 20 20 69 6e 74 20 63 32 20     \.    int c2 
1240: 3d 20 28 2a 7a 49 6e 2b 2b 29 3b 20 20 20 20 20  = (*zIn++);     
1250: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1260: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1270: 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20 20 20             \.   
1280: 20 63 32 20 2b 3d 20 28 28 2a 7a 49 6e 2b 2b 29   c2 += ((*zIn++)
1290: 3c 3c 38 29 3b 20 20 20 20 20 20 20 20 20 20 20  <<8);           
12a0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
12b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
12c0: 20 20 20 5c 0a 20 20 20 20 63 20 3d 20 28 63 32     \.    c = (c2
12d0: 26 30 78 30 33 46 46 29 20 2b 20 28 28 63 26 30  &0x03FF) + ((c&0
12e0: 78 30 30 33 46 29 3c 3c 31 30 29 20 2b 20 28 28  x003F)<<10) + ((
12f0: 28 63 26 30 78 30 33 43 30 29 2b 30 78 30 30 34  (c&0x03C0)+0x004
1300: 30 29 3c 3c 31 30 29 3b 20 20 20 5c 0a 20 20 20  0)<<10);   \.   
1310: 20 69 66 28 20 28 63 20 26 20 30 78 46 46 46 46   if( (c & 0xFFFF
1320: 30 30 30 30 29 3d 3d 30 20 29 20 63 20 3d 20 30  0000)==0 ) c = 0
1330: 78 46 46 46 44 3b 20 20 20 20 20 20 20 20 20 20  xFFFD;          
1340: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1350: 20 20 20 5c 0a 20 20 7d 20 20 20 20 20 20 20 20     \.  }        
1360: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1370: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1380: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1390: 20 20 20 20 20 20 20 20 20 20 20 5c 0a 7d 0a 0a             \.}..
13a0: 23 64 65 66 69 6e 65 20 52 45 41 44 5f 55 54 46  #define READ_UTF
13b0: 31 36 42 45 28 7a 49 6e 2c 20 63 29 7b 20 20 20  16BE(zIn, c){   
13c0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
13d0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
13e0: 20 20 20 20 20 20 5c 0a 20 20 63 20 3d 20 28 28        \.  c = ((
13f0: 2a 7a 49 6e 2b 2b 29 3c 3c 38 29 3b 20 20 20 20  *zIn++)<<8);    
1400: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1410: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1420: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a                \.
1430: 20 20 63 20 2b 3d 20 28 2a 7a 49 6e 2b 2b 29 3b    c += (*zIn++);
1440: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1450: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1460: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1470: 20 20 20 20 20 20 5c 0a 20 20 69 66 28 20 63 3e        \.  if( c>
1480: 3d 30 78 44 38 30 30 20 26 26 20 63 3c 30 78 45  =0xD800 && c<0xE
1490: 30 30 30 20 29 7b 20 20 20 20 20 20 20 20 20 20  000 ){          
14a0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
14b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20               \. 
14c0: 20 20 20 69 6e 74 20 63 32 20 3d 20 28 28 2a 7a     int c2 = ((*z
14d0: 49 6e 2b 2b 29 3c 3c 38 29 3b 20 20 20 20 20 20  In++)<<8);      
14e0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
14f0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1500: 20 20 20 20 20 5c 0a 20 20 20 20 63 32 20 2b 3d       \.    c2 +=
1510: 20 28 2a 7a 49 6e 2b 2b 29 3b 20 20 20 20 20 20   (*zIn++);      
1520: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1530: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1540: 20 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20               \. 
1550: 20 20 20 63 20 3d 20 28 63 32 26 30 78 30 33 46     c = (c2&0x03F
1560: 46 29 20 2b 20 28 28 63 26 30 78 30 30 33 46 29  F) + ((c&0x003F)
1570: 3c 3c 31 30 29 20 2b 20 28 28 28 63 26 30 78 30  <<10) + (((c&0x0
1580: 33 43 30 29 2b 30 78 30 30 34 30 29 3c 3c 31 30  3C0)+0x0040)<<10
1590: 29 3b 20 20 20 5c 0a 20 20 20 20 69 66 28 20 28  );   \.    if( (
15a0: 63 20 26 20 30 78 46 46 46 46 30 30 30 30 29 3d  c & 0xFFFF0000)=
15b0: 3d 30 20 29 20 63 20 3d 20 30 78 46 46 46 44 3b  =0 ) c = 0xFFFD;
15c0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
15d0: 20 20 20 20 20 20 20 20 20 20 20 20 20 5c 0a 20               \. 
15e0: 20 7d 20 20 20 20 20 20 20 20 20 20 20 20 20 20   }              
15f0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1600: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1610: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1620: 20 20 20 20 20 5c 0a 7d 0a 0a 2f 2a 0a 2a 2a 20       \.}../*.** 
1630: 49 66 20 74 68 65 20 54 52 41 4e 53 4c 41 54 45  If the TRANSLATE
1640: 5f 54 52 41 43 45 20 6d 61 63 72 6f 20 69 73 20  _TRACE macro is 
1650: 64 65 66 69 6e 65 64 2c 20 74 68 65 20 76 61 6c  defined, the val
1660: 75 65 20 6f 66 20 65 61 63 68 20 4d 65 6d 20 69  ue of each Mem i
1670: 73 0a 2a 2a 20 70 72 69 6e 74 65 64 20 6f 6e 20  s.** printed on 
1680: 73 74 64 65 72 72 20 6f 6e 20 74 68 65 20 77 61  stderr on the wa
1690: 79 20 69 6e 74 6f 20 61 6e 64 20 6f 75 74 20 6f  y into and out o
16a0: 66 20 73 71 6c 69 74 65 33 56 64 62 65 4d 65 6d  f sqlite3VdbeMem
16b0: 54 72 61 6e 73 6c 61 74 65 28 29 2e 0a 2a 2f 20  Translate()..*/ 
16c0: 0a 2f 2a 20 23 64 65 66 69 6e 65 20 54 52 41 4e  ./* #define TRAN
16d0: 53 4c 41 54 45 5f 54 52 41 43 45 20 31 20 2a 2f  SLATE_TRACE 1 */
16e0: 0a 0a 23 69 66 6e 64 65 66 20 53 51 4c 49 54 45  ..#ifndef SQLITE
16f0: 5f 4f 4d 49 54 5f 55 54 46 31 36 0a 2f 2a 0a 2a  _OMIT_UTF16./*.*
1700: 2a 20 54 68 69 73 20 72 6f 75 74 69 6e 65 20 74  * This routine t
1710: 72 61 6e 73 66 6f 72 6d 73 20 74 68 65 20 69 6e  ransforms the in
1720: 74 65 72 6e 61 6c 20 74 65 78 74 20 65 6e 63 6f  ternal text enco
1730: 64 69 6e 67 20 75 73 65 64 20 62 79 20 70 4d 65  ding used by pMe
1740: 6d 20 74 6f 0a 2a 2a 20 64 65 73 69 72 65 64 45  m to.** desiredE
1750: 6e 63 2e 20 49 74 20 69 73 20 61 6e 20 65 72 72  nc. It is an err
1760: 6f 72 20 69 66 20 74 68 65 20 73 74 72 69 6e 67  or if the string
1770: 20 69 73 20 61 6c 72 65 61 64 79 20 6f 66 20 74   is already of t
1780: 68 65 20 64 65 73 69 72 65 64 0a 2a 2a 20 65 6e  he desired.** en
1790: 63 6f 64 69 6e 67 2c 20 6f 72 20 69 66 20 2a 70  coding, or if *p
17a0: 4d 65 6d 20 64 6f 65 73 20 6e 6f 74 20 63 6f 6e  Mem does not con
17b0: 74 61 69 6e 20 61 20 73 74 72 69 6e 67 20 76 61  tain a string va
17c0: 6c 75 65 2e 0a 2a 2f 0a 69 6e 74 20 73 71 6c 69  lue..*/.int sqli
17d0: 74 65 33 56 64 62 65 4d 65 6d 54 72 61 6e 73 6c  te3VdbeMemTransl
17e0: 61 74 65 28 4d 65 6d 20 2a 70 4d 65 6d 2c 20 75  ate(Mem *pMem, u
17f0: 38 20 64 65 73 69 72 65 64 45 6e 63 29 7b 0a 20  8 desiredEnc){. 
1800: 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 7a   unsigned char z
1810: 53 68 6f 72 74 5b 4e 42 46 53 5d 3b 20 2f 2a 20  Short[NBFS]; /* 
1820: 54 65 6d 70 6f 72 61 72 79 20 73 68 6f 72 74 20  Temporary short 
1830: 6f 75 74 70 75 74 20 62 75 66 66 65 72 20 2a 2f  output buffer */
1840: 0a 20 20 69 6e 74 20 6c 65 6e 3b 20 20 20 20 20  .  int len;     
1850: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 2f                 /
1860: 2a 20 4d 61 78 69 6d 75 6d 20 6c 65 6e 67 74 68  * Maximum length
1870: 20 6f 66 20 6f 75 74 70 75 74 20 73 74 72 69 6e   of output strin
1880: 67 20 69 6e 20 62 79 74 65 73 20 2a 2f 0a 20 20  g in bytes */.  
1890: 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a 7a  unsigned char *z
18a0: 4f 75 74 3b 20 20 20 20 20 20 20 20 20 20 20 20  Out;            
18b0: 20 20 20 20 20 20 2f 2a 20 4f 75 74 70 75 74 20        /* Output 
18c0: 62 75 66 66 65 72 20 2a 2f 0a 20 20 75 6e 73 69  buffer */.  unsi
18d0: 67 6e 65 64 20 63 68 61 72 20 2a 7a 49 6e 3b 20  gned char *zIn; 
18e0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
18f0: 20 20 2f 2a 20 49 6e 70 75 74 20 69 74 65 72 61    /* Input itera
1900: 74 6f 72 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65  tor */.  unsigne
1910: 64 20 63 68 61 72 20 2a 7a 54 65 72 6d 3b 20 20  d char *zTerm;  
1920: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 2f                 /
1930: 2a 20 45 6e 64 20 6f 66 20 69 6e 70 75 74 20 2a  * End of input *
1940: 2f 0a 20 20 75 6e 73 69 67 6e 65 64 20 63 68 61  /.  unsigned cha
1950: 72 20 2a 7a 3b 20 20 20 20 20 20 20 20 20 20 20  r *z;           
1960: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 4f 75 74            /* Out
1970: 70 75 74 20 69 74 65 72 61 74 6f 72 20 2a 2f 0a  put iterator */.
1980: 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74 20 63    unsigned int c
1990: 3b 0a 0a 20 20 61 73 73 65 72 74 28 20 70 4d 65  ;..  assert( pMe
19a0: 6d 2d 3e 66 6c 61 67 73 26 4d 45 4d 5f 53 74 72  m->flags&MEM_Str
19b0: 20 29 3b 0a 20 20 61 73 73 65 72 74 28 20 70 4d   );.  assert( pM
19c0: 65 6d 2d 3e 65 6e 63 21 3d 64 65 73 69 72 65 64  em->enc!=desired
19d0: 45 6e 63 20 29 3b 0a 20 20 61 73 73 65 72 74 28  Enc );.  assert(
19e0: 20 70 4d 65 6d 2d 3e 65 6e 63 21 3d 30 20 29 3b   pMem->enc!=0 );
19f0: 0a 20 20 61 73 73 65 72 74 28 20 70 4d 65 6d 2d  .  assert( pMem-
1a00: 3e 6e 3e 3d 30 20 29 3b 0a 0a 23 69 66 20 64 65  >n>=0 );..#if de
1a10: 66 69 6e 65 64 28 54 52 41 4e 53 4c 41 54 45 5f  fined(TRANSLATE_
1a20: 54 52 41 43 45 29 20 26 26 20 64 65 66 69 6e 65  TRACE) && define
1a30: 64 28 53 51 4c 49 54 45 5f 44 45 42 55 47 29 0a  d(SQLITE_DEBUG).
1a40: 20 20 7b 0a 20 20 20 20 63 68 61 72 20 7a 42 75    {.    char zBu
1a50: 66 5b 31 30 30 5d 3b 0a 20 20 20 20 73 71 6c 69  f[100];.    sqli
1a60: 74 65 33 56 64 62 65 4d 65 6d 50 72 65 74 74 79  te3VdbeMemPretty
1a70: 50 72 69 6e 74 28 70 4d 65 6d 2c 20 7a 42 75 66  Print(pMem, zBuf
1a80: 29 3b 0a 20 20 20 20 66 70 72 69 6e 74 66 28 73  );.    fprintf(s
1a90: 74 64 65 72 72 2c 20 22 49 4e 50 55 54 3a 20 20  tderr, "INPUT:  
1aa0: 25 73 5c 6e 22 2c 20 7a 42 75 66 29 3b 0a 20 20  %s\n", zBuf);.  
1ab0: 7d 0a 23 65 6e 64 69 66 0a 0a 20 20 2f 2a 20 49  }.#endif..  /* I
1ac0: 66 20 74 68 65 20 74 72 61 6e 73 6c 61 74 69 6f  f the translatio
1ad0: 6e 20 69 73 20 62 65 74 77 65 65 6e 20 55 54 46  n is between UTF
1ae0: 2d 31 36 20 6c 69 74 74 6c 65 20 61 6e 64 20 62  -16 little and b
1af0: 69 67 20 65 6e 64 69 61 6e 2c 20 74 68 65 6e 20  ig endian, then 
1b00: 0a 20 20 2a 2a 20 61 6c 6c 20 74 68 61 74 20 69  .  ** all that i
1b10: 73 20 72 65 71 75 69 72 65 64 20 69 73 20 74 6f  s required is to
1b20: 20 73 77 61 70 20 74 68 65 20 62 79 74 65 20 6f   swap the byte o
1b30: 72 64 65 72 2e 20 54 68 69 73 20 63 61 73 65 20  rder. This case 
1b40: 69 73 20 68 61 6e 64 6c 65 64 0a 20 20 2a 2a 20  is handled.  ** 
1b50: 64 69 66 66 65 72 65 6e 74 6c 79 20 66 72 6f 6d  differently from
1b60: 20 74 68 65 20 6f 74 68 65 72 73 2e 0a 20 20 2a   the others..  *
1b70: 2f 0a 20 20 69 66 28 20 70 4d 65 6d 2d 3e 65 6e  /.  if( pMem->en
1b80: 63 21 3d 53 51 4c 49 54 45 5f 55 54 46 38 20 26  c!=SQLITE_UTF8 &
1b90: 26 20 64 65 73 69 72 65 64 45 6e 63 21 3d 53 51  & desiredEnc!=SQ
1ba0: 4c 49 54 45 5f 55 54 46 38 20 29 7b 0a 20 20 20  LITE_UTF8 ){.   
1bb0: 20 75 38 20 74 65 6d 70 3b 0a 20 20 20 20 69 6e   u8 temp;.    in
1bc0: 74 20 72 63 3b 0a 20 20 20 20 72 63 20 3d 20 73  t rc;.    rc = s
1bd0: 71 6c 69 74 65 33 56 64 62 65 4d 65 6d 4d 61 6b  qlite3VdbeMemMak
1be0: 65 57 72 69 74 65 61 62 6c 65 28 70 4d 65 6d 29  eWriteable(pMem)
1bf0: 3b 0a 20 20 20 20 69 66 28 20 72 63 21 3d 53 51  ;.    if( rc!=SQ
1c00: 4c 49 54 45 5f 4f 4b 20 29 7b 0a 20 20 20 20 20  LITE_OK ){.     
1c10: 20 61 73 73 65 72 74 28 20 72 63 3d 3d 53 51 4c   assert( rc==SQL
1c20: 49 54 45 5f 4e 4f 4d 45 4d 20 29 3b 0a 20 20 20  ITE_NOMEM );.   
1c30: 20 20 20 72 65 74 75 72 6e 20 53 51 4c 49 54 45     return SQLITE
1c40: 5f 4e 4f 4d 45 4d 3b 0a 20 20 20 20 7d 0a 20 20  _NOMEM;.    }.  
1c50: 20 20 7a 49 6e 20 3d 20 28 75 38 2a 29 70 4d 65    zIn = (u8*)pMe
1c60: 6d 2d 3e 7a 3b 0a 20 20 20 20 7a 54 65 72 6d 20  m->z;.    zTerm 
1c70: 3d 20 26 7a 49 6e 5b 70 4d 65 6d 2d 3e 6e 5d 3b  = &zIn[pMem->n];
1c80: 0a 20 20 20 20 77 68 69 6c 65 28 20 7a 49 6e 3c  .    while( zIn<
1c90: 7a 54 65 72 6d 20 29 7b 0a 20 20 20 20 20 20 74  zTerm ){.      t
1ca0: 65 6d 70 20 3d 20 2a 7a 49 6e 3b 0a 20 20 20 20  emp = *zIn;.    
1cb0: 20 20 2a 7a 49 6e 20 3d 20 2a 28 7a 49 6e 2b 31    *zIn = *(zIn+1
1cc0: 29 3b 0a 20 20 20 20 20 20 7a 49 6e 2b 2b 3b 0a  );.      zIn++;.
1cd0: 20 20 20 20 20 20 2a 7a 49 6e 2b 2b 20 3d 20 74        *zIn++ = t
1ce0: 65 6d 70 3b 0a 20 20 20 20 7d 0a 20 20 20 20 70  emp;.    }.    p
1cf0: 4d 65 6d 2d 3e 65 6e 63 20 3d 20 64 65 73 69 72  Mem->enc = desir
1d00: 65 64 45 6e 63 3b 0a 20 20 20 20 67 6f 74 6f 20  edEnc;.    goto 
1d10: 74 72 61 6e 73 6c 61 74 65 5f 6f 75 74 3b 0a 20  translate_out;. 
1d20: 20 7d 0a 0a 20 20 2f 2a 20 53 65 74 20 6c 65 6e   }..  /* Set len
1d30: 20 74 6f 20 74 68 65 20 6d 61 78 69 6d 75 6d 20   to the maximum 
1d40: 6e 75 6d 62 65 72 20 6f 66 20 62 79 74 65 73 20  number of bytes 
1d50: 72 65 71 75 69 72 65 64 20 69 6e 20 74 68 65 20  required in the 
1d60: 6f 75 74 70 75 74 20 62 75 66 66 65 72 2e 20 2a  output buffer. *
1d70: 2f 0a 20 20 69 66 28 20 64 65 73 69 72 65 64 45  /.  if( desiredE
1d80: 6e 63 3d 3d 53 51 4c 49 54 45 5f 55 54 46 38 20  nc==SQLITE_UTF8 
1d90: 29 7b 0a 20 20 20 20 2f 2a 20 57 68 65 6e 20 63  ){.    /* When c
1da0: 6f 6e 76 65 72 74 69 6e 67 20 66 72 6f 6d 20 55  onverting from U
1db0: 54 46 2d 31 36 2c 20 74 68 65 20 6d 61 78 69 6d  TF-16, the maxim
1dc0: 75 6d 20 67 72 6f 77 74 68 20 72 65 73 75 6c 74  um growth result
1dd0: 73 20 66 72 6f 6d 0a 20 20 20 20 2a 2a 20 74 72  s from.    ** tr
1de0: 61 6e 73 6c 61 74 69 6e 67 20 61 20 32 2d 62 79  anslating a 2-by
1df0: 74 65 20 63 68 61 72 61 63 74 65 72 20 74 6f 20  te character to 
1e00: 61 20 34 2d 62 79 74 65 20 55 54 46 2d 38 20 63  a 4-byte UTF-8 c
1e10: 68 61 72 61 63 74 65 72 2e 0a 20 20 20 20 2a 2a  haracter..    **
1e20: 20 41 20 73 69 6e 67 6c 65 20 62 79 74 65 20 69   A single byte i
1e30: 73 20 72 65 71 75 69 72 65 64 20 66 6f 72 20 74  s required for t
1e40: 68 65 20 6f 75 74 70 75 74 20 73 74 72 69 6e 67  he output string
1e50: 0a 20 20 20 20 2a 2a 20 6e 75 6c 2d 74 65 72 6d  .    ** nul-term
1e60: 69 6e 61 74 6f 72 2e 0a 20 20 20 20 2a 2f 0a 20  inator..    */. 
1e70: 20 20 20 6c 65 6e 20 3d 20 70 4d 65 6d 2d 3e 6e     len = pMem->n
1e80: 20 2a 20 32 20 2b 20 31 3b 0a 20 20 7d 65 6c 73   * 2 + 1;.  }els
1e90: 65 7b 0a 20 20 20 20 2f 2a 20 57 68 65 6e 20 63  e{.    /* When c
1ea0: 6f 6e 76 65 72 74 69 6e 67 20 66 72 6f 6d 20 55  onverting from U
1eb0: 54 46 2d 38 20 74 6f 20 55 54 46 2d 31 36 20 74  TF-8 to UTF-16 t
1ec0: 68 65 20 6d 61 78 69 6d 75 6d 20 67 72 6f 77 74  he maximum growt
1ed0: 68 20 69 73 20 63 61 75 73 65 64 0a 20 20 20 20  h is caused.    
1ee0: 2a 2a 20 77 68 65 6e 20 61 20 31 2d 62 79 74 65  ** when a 1-byte
1ef0: 20 55 54 46 2d 38 20 63 68 61 72 61 63 74 65 72   UTF-8 character
1f00: 20 69 73 20 74 72 61 6e 73 6c 61 74 65 64 20 69   is translated i
1f10: 6e 74 6f 20 61 20 32 2d 62 79 74 65 20 55 54 46  nto a 2-byte UTF
1f20: 2d 31 36 0a 20 20 20 20 2a 2a 20 63 68 61 72 61  -16.    ** chara
1f30: 63 74 65 72 2e 20 54 77 6f 20 62 79 74 65 73 20  cter. Two bytes 
1f40: 61 72 65 20 72 65 71 75 69 72 65 64 20 69 6e 20  are required in 
1f50: 74 68 65 20 6f 75 74 70 75 74 20 62 75 66 66 65  the output buffe
1f60: 72 20 66 6f 72 20 74 68 65 0a 20 20 20 20 2a 2a  r for the.    **
1f70: 20 6e 75 6c 2d 74 65 72 6d 69 6e 61 74 6f 72 2e   nul-terminator.
1f80: 0a 20 20 20 20 2a 2f 0a 20 20 20 20 6c 65 6e 20  .    */.    len 
1f90: 3d 20 70 4d 65 6d 2d 3e 6e 20 2a 20 32 20 2b 20  = pMem->n * 2 + 
1fa0: 32 3b 0a 20 20 7d 0a 0a 20 20 2f 2a 20 53 65 74  2;.  }..  /* Set
1fb0: 20 7a 49 6e 20 74 6f 20 70 6f 69 6e 74 20 61 74   zIn to point at
1fc0: 20 74 68 65 20 73 74 61 72 74 20 6f 66 20 74 68   the start of th
1fd0: 65 20 69 6e 70 75 74 20 62 75 66 66 65 72 20 61  e input buffer a
1fe0: 6e 64 20 7a 54 65 72 6d 20 74 6f 20 70 6f 69 6e  nd zTerm to poin
1ff0: 74 20 31 0a 20 20 2a 2a 20 62 79 74 65 20 70 61  t 1.  ** byte pa
2000: 73 74 20 74 68 65 20 65 6e 64 2e 0a 20 20 2a 2a  st the end..  **
2010: 0a 20 20 2a 2a 20 56 61 72 69 61 62 6c 65 20 7a  .  ** Variable z
2020: 4f 75 74 20 69 73 20 73 65 74 20 74 6f 20 70 6f  Out is set to po
2030: 69 6e 74 20 61 74 20 74 68 65 20 6f 75 74 70 75  int at the outpu
2040: 74 20 62 75 66 66 65 72 2e 20 54 68 69 73 20 6d  t buffer. This m
2050: 61 79 20 62 65 20 73 70 61 63 65 0a 20 20 2a 2a  ay be space.  **
2060: 20 6f 62 74 61 69 6e 65 64 20 66 72 6f 6d 20 6d   obtained from m
2070: 61 6c 6c 6f 63 28 29 2c 20 6f 72 20 4d 65 6d 2e  alloc(), or Mem.
2080: 7a 53 68 6f 72 74 2c 20 69 66 20 69 74 20 6c 61  zShort, if it la
2090: 72 67 65 20 65 6e 6f 75 67 68 20 61 6e 64 20 6e  rge enough and n
20a0: 6f 74 20 69 6e 0a 20 20 2a 2a 20 75 73 65 2c 20  ot in.  ** use, 
20b0: 6f 72 20 74 68 65 20 7a 53 68 6f 72 74 20 61 72  or the zShort ar
20c0: 72 61 79 20 6f 6e 20 74 68 65 20 73 74 61 63 6b  ray on the stack
20d0: 20 28 73 65 65 20 61 62 6f 76 65 29 2e 0a 20 20   (see above)..  
20e0: 2a 2f 0a 20 20 7a 49 6e 20 3d 20 28 75 38 2a 29  */.  zIn = (u8*)
20f0: 70 4d 65 6d 2d 3e 7a 3b 0a 20 20 7a 54 65 72 6d  pMem->z;.  zTerm
2100: 20 3d 20 26 7a 49 6e 5b 70 4d 65 6d 2d 3e 6e 5d   = &zIn[pMem->n]
2110: 3b 0a 20 20 69 66 28 20 6c 65 6e 3e 4e 42 46 53  ;.  if( len>NBFS
2120: 20 29 7b 0a 20 20 20 20 7a 4f 75 74 20 3d 20 73   ){.    zOut = s
2130: 71 6c 69 74 65 4d 61 6c 6c 6f 63 52 61 77 28 6c  qliteMallocRaw(l
2140: 65 6e 29 3b 0a 20 20 20 20 69 66 28 20 21 7a 4f  en);.    if( !zO
2150: 75 74 20 29 20 72 65 74 75 72 6e 20 53 51 4c 49  ut ) return SQLI
2160: 54 45 5f 4e 4f 4d 45 4d 3b 0a 20 20 7d 65 6c 73  TE_NOMEM;.  }els
2170: 65 7b 0a 20 20 20 20 7a 4f 75 74 20 3d 20 7a 53  e{.    zOut = zS
2180: 68 6f 72 74 3b 0a 20 20 7d 0a 20 20 7a 20 3d 20  hort;.  }.  z = 
2190: 7a 4f 75 74 3b 0a 0a 20 20 69 66 28 20 70 4d 65  zOut;..  if( pMe
21a0: 6d 2d 3e 65 6e 63 3d 3d 53 51 4c 49 54 45 5f 55  m->enc==SQLITE_U
21b0: 54 46 38 20 29 7b 0a 20 20 20 20 69 66 28 20 64  TF8 ){.    if( d
21c0: 65 73 69 72 65 64 45 6e 63 3d 3d 53 51 4c 49 54  esiredEnc==SQLIT
21d0: 45 5f 55 54 46 31 36 4c 45 20 29 7b 0a 20 20 20  E_UTF16LE ){.   
21e0: 20 20 20 2f 2a 20 55 54 46 2d 38 20 2d 3e 20 55     /* UTF-8 -> U
21f0: 54 46 2d 31 36 20 4c 69 74 74 6c 65 2d 65 6e 64  TF-16 Little-end
2200: 69 61 6e 20 2a 2f 0a 20 20 20 20 20 20 77 68 69  ian */.      whi
2210: 6c 65 28 20 7a 49 6e 3c 7a 54 65 72 6d 20 29 7b  le( zIn<zTerm ){
2220: 0a 20 20 20 20 20 20 20 20 53 51 4c 49 54 45 5f  .        SQLITE_
2230: 52 45 41 44 5f 55 54 46 38 28 7a 49 6e 2c 20 63  READ_UTF8(zIn, c
2240: 29 3b 20 0a 20 20 20 20 20 20 20 20 57 52 49 54  ); .        WRIT
2250: 45 5f 55 54 46 31 36 4c 45 28 7a 2c 20 63 29 3b  E_UTF16LE(z, c);
2260: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 7d 65 6c  .      }.    }el
2270: 73 65 7b 0a 20 20 20 20 20 20 61 73 73 65 72 74  se{.      assert
2280: 28 20 64 65 73 69 72 65 64 45 6e 63 3d 3d 53 51  ( desiredEnc==SQ
2290: 4c 49 54 45 5f 55 54 46 31 36 42 45 20 29 3b 0a  LITE_UTF16BE );.
22a0: 20 20 20 20 20 20 2f 2a 20 55 54 46 2d 38 20 2d        /* UTF-8 -
22b0: 3e 20 55 54 46 2d 31 36 20 42 69 67 2d 65 6e 64  > UTF-16 Big-end
22c0: 69 61 6e 20 2a 2f 0a 20 20 20 20 20 20 77 68 69  ian */.      whi
22d0: 6c 65 28 20 7a 49 6e 3c 7a 54 65 72 6d 20 29 7b  le( zIn<zTerm ){
22e0: 0a 20 20 20 20 20 20 20 20 53 51 4c 49 54 45 5f  .        SQLITE_
22f0: 52 45 41 44 5f 55 54 46 38 28 7a 49 6e 2c 20 63  READ_UTF8(zIn, c
2300: 29 3b 20 0a 20 20 20 20 20 20 20 20 57 52 49 54  ); .        WRIT
2310: 45 5f 55 54 46 31 36 42 45 28 7a 2c 20 63 29 3b  E_UTF16BE(z, c);
2320: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 7d 0a 20  .      }.    }. 
2330: 20 20 20 70 4d 65 6d 2d 3e 6e 20 3d 20 7a 20 2d     pMem->n = z -
2340: 20 7a 4f 75 74 3b 0a 20 20 20 20 2a 7a 2b 2b 20   zOut;.    *z++ 
2350: 3d 20 30 3b 0a 20 20 7d 65 6c 73 65 7b 0a 20 20  = 0;.  }else{.  
2360: 20 20 61 73 73 65 72 74 28 20 64 65 73 69 72 65    assert( desire
2370: 64 45 6e 63 3d 3d 53 51 4c 49 54 45 5f 55 54 46  dEnc==SQLITE_UTF
2380: 38 20 29 3b 0a 20 20 20 20 69 66 28 20 70 4d 65  8 );.    if( pMe
2390: 6d 2d 3e 65 6e 63 3d 3d 53 51 4c 49 54 45 5f 55  m->enc==SQLITE_U
23a0: 54 46 31 36 4c 45 20 29 7b 0a 20 20 20 20 20 20  TF16LE ){.      
23b0: 2f 2a 20 55 54 46 2d 31 36 20 4c 69 74 74 6c 65  /* UTF-16 Little
23c0: 2d 65 6e 64 69 61 6e 20 2d 3e 20 55 54 46 2d 38  -endian -> UTF-8
23d0: 20 2a 2f 0a 20 20 20 20 20 20 77 68 69 6c 65 28   */.      while(
23e0: 20 7a 49 6e 3c 7a 54 65 72 6d 20 29 7b 0a 20 20   zIn<zTerm ){.  
23f0: 20 20 20 20 20 20 52 45 41 44 5f 55 54 46 31 36        READ_UTF16
2400: 4c 45 28 7a 49 6e 2c 20 63 29 3b 20 0a 20 20 20  LE(zIn, c); .   
2410: 20 20 20 20 20 57 52 49 54 45 5f 55 54 46 38 28       WRITE_UTF8(
2420: 7a 2c 20 63 29 3b 0a 20 20 20 20 20 20 7d 0a 20  z, c);.      }. 
2430: 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20     }else{.      
2440: 2f 2a 20 55 54 46 2d 31 36 20 4c 69 74 74 6c 65  /* UTF-16 Little
2450: 2d 65 6e 64 69 61 6e 20 2d 3e 20 55 54 46 2d 38  -endian -> UTF-8
2460: 20 2a 2f 0a 20 20 20 20 20 20 77 68 69 6c 65 28   */.      while(
2470: 20 7a 49 6e 3c 7a 54 65 72 6d 20 29 7b 0a 20 20   zIn<zTerm ){.  
2480: 20 20 20 20 20 20 52 45 41 44 5f 55 54 46 31 36        READ_UTF16
2490: 42 45 28 7a 49 6e 2c 20 63 29 3b 20 0a 20 20 20  BE(zIn, c); .   
24a0: 20 20 20 20 20 57 52 49 54 45 5f 55 54 46 38 28       WRITE_UTF8(
24b0: 7a 2c 20 63 29 3b 0a 20 20 20 20 20 20 7d 0a 20  z, c);.      }. 
24c0: 20 20 20 7d 0a 20 20 20 20 70 4d 65 6d 2d 3e 6e     }.    pMem->n
24d0: 20 3d 20 7a 20 2d 20 7a 4f 75 74 3b 0a 20 20 7d   = z - zOut;.  }
24e0: 0a 20 20 2a 7a 20 3d 20 30 3b 0a 20 20 61 73 73  .  *z = 0;.  ass
24f0: 65 72 74 28 20 28 70 4d 65 6d 2d 3e 6e 2b 28 64  ert( (pMem->n+(d
2500: 65 73 69 72 65 64 45 6e 63 3d 3d 53 51 4c 49 54  esiredEnc==SQLIT
2510: 45 5f 55 54 46 38 3f 31 3a 32 29 29 3c 3d 6c 65  E_UTF8?1:2))<=le
2520: 6e 20 29 3b 0a 0a 20 20 73 71 6c 69 74 65 33 56  n );..  sqlite3V
2530: 64 62 65 4d 65 6d 52 65 6c 65 61 73 65 28 70 4d  dbeMemRelease(pM
2540: 65 6d 29 3b 0a 20 20 70 4d 65 6d 2d 3e 66 6c 61  em);.  pMem->fla
2550: 67 73 20 26 3d 20 7e 28 4d 45 4d 5f 53 74 61 74  gs &= ~(MEM_Stat
2560: 69 63 7c 4d 45 4d 5f 44 79 6e 7c 4d 45 4d 5f 45  ic|MEM_Dyn|MEM_E
2570: 70 68 65 6d 7c 4d 45 4d 5f 53 68 6f 72 74 29 3b  phem|MEM_Short);
2580: 0a 20 20 70 4d 65 6d 2d 3e 65 6e 63 20 3d 20 64  .  pMem->enc = d
2590: 65 73 69 72 65 64 45 6e 63 3b 0a 20 20 69 66 28  esiredEnc;.  if(
25a0: 20 7a 4f 75 74 3d 3d 7a 53 68 6f 72 74 20 29 7b   zOut==zShort ){
25b0: 0a 20 20 20 20 6d 65 6d 63 70 79 28 70 4d 65 6d  .    memcpy(pMem
25c0: 2d 3e 7a 53 68 6f 72 74 2c 20 7a 4f 75 74 2c 20  ->zShort, zOut, 
25d0: 6c 65 6e 29 3b 0a 20 20 20 20 7a 4f 75 74 20 3d  len);.    zOut =
25e0: 20 28 75 38 2a 29 70 4d 65 6d 2d 3e 7a 53 68 6f   (u8*)pMem->zSho
25f0: 72 74 3b 0a 20 20 20 20 70 4d 65 6d 2d 3e 66 6c  rt;.    pMem->fl
2600: 61 67 73 20 7c 3d 20 28 4d 45 4d 5f 54 65 72 6d  ags |= (MEM_Term
2610: 7c 4d 45 4d 5f 53 68 6f 72 74 29 3b 0a 20 20 7d  |MEM_Short);.  }
2620: 65 6c 73 65 7b 0a 20 20 20 20 70 4d 65 6d 2d 3e  else{.    pMem->
2630: 66 6c 61 67 73 20 7c 3d 20 28 4d 45 4d 5f 54 65  flags |= (MEM_Te
2640: 72 6d 7c 4d 45 4d 5f 44 79 6e 29 3b 0a 20 20 7d  rm|MEM_Dyn);.  }
2650: 0a 20 20 70 4d 65 6d 2d 3e 7a 20 3d 20 28 63 68  .  pMem->z = (ch
2660: 61 72 2a 29 7a 4f 75 74 3b 0a 0a 74 72 61 6e 73  ar*)zOut;..trans
2670: 6c 61 74 65 5f 6f 75 74 3a 0a 23 69 66 20 64 65  late_out:.#if de
2680: 66 69 6e 65 64 28 54 52 41 4e 53 4c 41 54 45 5f  fined(TRANSLATE_
2690: 54 52 41 43 45 29 20 26 26 20 64 65 66 69 6e 65  TRACE) && define
26a0: 64 28 53 51 4c 49 54 45 5f 44 45 42 55 47 29 0a  d(SQLITE_DEBUG).
26b0: 20 20 7b 0a 20 20 20 20 63 68 61 72 20 7a 42 75    {.    char zBu
26c0: 66 5b 31 30 30 5d 3b 0a 20 20 20 20 73 71 6c 69  f[100];.    sqli
26d0: 74 65 33 56 64 62 65 4d 65 6d 50 72 65 74 74 79  te3VdbeMemPretty
26e0: 50 72 69 6e 74 28 70 4d 65 6d 2c 20 7a 42 75 66  Print(pMem, zBuf
26f0: 29 3b 0a 20 20 20 20 66 70 72 69 6e 74 66 28 73  );.    fprintf(s
2700: 74 64 65 72 72 2c 20 22 4f 55 54 50 55 54 3a 20  tderr, "OUTPUT: 
2710: 25 73 5c 6e 22 2c 20 7a 42 75 66 29 3b 0a 20 20  %s\n", zBuf);.  
2720: 7d 0a 23 65 6e 64 69 66 0a 20 20 72 65 74 75 72  }.#endif.  retur
2730: 6e 20 53 51 4c 49 54 45 5f 4f 4b 3b 0a 7d 0a 0a  n SQLITE_OK;.}..
2740: 2f 2a 0a 2a 2a 20 54 68 69 73 20 72 6f 75 74 69  /*.** This routi
2750: 6e 65 20 63 68 65 63 6b 73 20 66 6f 72 20 61 20  ne checks for a 
2760: 62 79 74 65 2d 6f 72 64 65 72 20 6d 61 72 6b 20  byte-order mark 
2770: 61 74 20 74 68 65 20 62 65 67 69 6e 6e 69 6e 67  at the beginning
2780: 20 6f 66 20 74 68 65 20 0a 2a 2a 20 55 54 46 2d   of the .** UTF-
2790: 31 36 20 73 74 72 69 6e 67 20 73 74 6f 72 65 64  16 string stored
27a0: 20 69 6e 20 2a 70 4d 65 6d 2e 20 49 66 20 6f 6e   in *pMem. If on
27b0: 65 20 69 73 20 70 72 65 73 65 6e 74 2c 20 69 74  e is present, it
27c0: 20 69 73 20 72 65 6d 6f 76 65 64 20 61 6e 64 0a   is removed and.
27d0: 2a 2a 20 74 68 65 20 65 6e 63 6f 64 69 6e 67 20  ** the encoding 
27e0: 6f 66 20 74 68 65 20 4d 65 6d 20 61 64 6a 75 73  of the Mem adjus
27f0: 74 65 64 2e 20 54 68 69 73 20 72 6f 75 74 69 6e  ted. This routin
2800: 65 20 64 6f 65 73 20 6e 6f 74 20 64 6f 20 61 6e  e does not do an
2810: 79 0a 2a 2a 20 62 79 74 65 2d 73 77 61 70 70 69  y.** byte-swappi
2820: 6e 67 2c 20 69 74 20 6a 75 73 74 20 73 65 74 73  ng, it just sets
2830: 20 4d 65 6d 2e 65 6e 63 20 61 70 70 72 6f 70 72   Mem.enc appropr
2840: 69 61 74 65 6c 79 2e 0a 2a 2a 0a 2a 2a 20 54 68  iately..**.** Th
2850: 65 20 61 6c 6c 6f 63 61 74 69 6f 6e 20 28 73 74  e allocation (st
2860: 61 74 69 63 2c 20 64 79 6e 61 6d 69 63 20 65 74  atic, dynamic et
2870: 63 2e 29 20 61 6e 64 20 65 6e 63 6f 64 69 6e 67  c.) and encoding
2880: 20 6f 66 20 74 68 65 20 4d 65 6d 20 6d 61 79 20   of the Mem may 
2890: 62 65 0a 2a 2a 20 63 68 61 6e 67 65 64 20 62 79  be.** changed by
28a0: 20 74 68 69 73 20 66 75 6e 63 74 69 6f 6e 2e 0a   this function..
28b0: 2a 2f 0a 69 6e 74 20 73 71 6c 69 74 65 33 56 64  */.int sqlite3Vd
28c0: 62 65 4d 65 6d 48 61 6e 64 6c 65 42 6f 6d 28 4d  beMemHandleBom(M
28d0: 65 6d 20 2a 70 4d 65 6d 29 7b 0a 20 20 69 6e 74  em *pMem){.  int
28e0: 20 72 63 20 3d 20 53 51 4c 49 54 45 5f 4f 4b 3b   rc = SQLITE_OK;
28f0: 0a 20 20 75 38 20 62 6f 6d 20 3d 20 30 3b 0a 0a  .  u8 bom = 0;..
2900: 20 20 69 66 28 20 70 4d 65 6d 2d 3e 6e 3c 30 20    if( pMem->n<0 
2910: 7c 7c 20 70 4d 65 6d 2d 3e 6e 3e 31 20 29 7b 0a  || pMem->n>1 ){.
2920: 20 20 20 20 75 38 20 62 31 20 3d 20 2a 28 75 38      u8 b1 = *(u8
2930: 20 2a 29 70 4d 65 6d 2d 3e 7a 3b 0a 20 20 20 20   *)pMem->z;.    
2940: 75 38 20 62 32 20 3d 20 2a 28 28 28 75 38 20 2a  u8 b2 = *(((u8 *
2950: 29 70 4d 65 6d 2d 3e 7a 29 20 2b 20 31 29 3b 0a  )pMem->z) + 1);.
2960: 20 20 20 20 69 66 28 20 62 31 3d 3d 30 78 46 45      if( b1==0xFE
2970: 20 26 26 20 62 32 3d 3d 30 78 46 46 20 29 7b 0a   && b2==0xFF ){.
2980: 20 20 20 20 20 20 62 6f 6d 20 3d 20 53 51 4c 49        bom = SQLI
2990: 54 45 5f 55 54 46 31 36 42 45 3b 0a 20 20 20 20  TE_UTF16BE;.    
29a0: 7d 0a 20 20 20 20 69 66 28 20 62 31 3d 3d 30 78  }.    if( b1==0x
29b0: 46 46 20 26 26 20 62 32 3d 3d 30 78 46 45 20 29  FF && b2==0xFE )
29c0: 7b 0a 20 20 20 20 20 20 62 6f 6d 20 3d 20 53 51  {.      bom = SQ
29d0: 4c 49 54 45 5f 55 54 46 31 36 4c 45 3b 0a 20 20  LITE_UTF16LE;.  
29e0: 20 20 7d 0a 20 20 7d 0a 20 20 0a 20 20 69 66 28    }.  }.  .  if(
29f0: 20 62 6f 6d 20 29 7b 0a 20 20 20 20 2f 2a 20 54   bom ){.    /* T
2a00: 68 69 73 20 66 75 6e 63 74 69 6f 6e 20 69 73 20  his function is 
2a10: 63 61 6c 6c 65 64 20 61 73 20 73 6f 6f 6e 20 61  called as soon a
2a20: 73 20 61 20 73 74 72 69 6e 67 20 69 73 20 73 74  s a string is st
2a30: 6f 72 65 64 20 69 6e 20 61 20 4d 65 6d 2a 2c 0a  ored in a Mem*,.
2a40: 20 20 20 20 2a 2a 20 66 72 6f 6d 20 77 69 74 68      ** from with
2a50: 69 6e 20 73 71 6c 69 74 65 33 56 64 62 65 4d 65  in sqlite3VdbeMe
2a60: 6d 53 65 74 53 74 72 28 29 2e 20 41 74 20 74 68  mSetStr(). At th
2a70: 61 74 20 70 6f 69 6e 74 20 69 74 20 69 73 20 6e  at point it is n
2a80: 6f 74 20 70 6f 73 73 69 62 6c 65 0a 20 20 20 20  ot possible.    
2a90: 2a 2a 20 66 6f 72 20 74 68 65 20 73 74 72 69 6e  ** for the strin
2aa0: 67 20 74 6f 20 62 65 20 73 74 6f 72 65 64 20 69  g to be stored i
2ab0: 6e 20 4d 65 6d 2e 7a 53 68 6f 72 74 2c 20 6f 72  n Mem.zShort, or
2ac0: 20 66 6f 72 20 69 74 20 74 6f 20 62 65 20 73 74   for it to be st
2ad0: 6f 72 65 64 0a 20 20 20 20 2a 2a 20 69 6e 20 64  ored.    ** in d
2ae0: 79 6e 61 6d 69 63 20 6d 65 6d 6f 72 79 20 77 69  ynamic memory wi
2af0: 74 68 20 6e 6f 20 64 65 73 74 72 75 63 74 6f 72  th no destructor
2b00: 2e 0a 20 20 20 20 2a 2f 0a 20 20 20 20 61 73 73  ..    */.    ass
2b10: 65 72 74 28 20 21 28 70 4d 65 6d 2d 3e 66 6c 61  ert( !(pMem->fla
2b20: 67 73 26 4d 45 4d 5f 53 68 6f 72 74 29 20 29 3b  gs&MEM_Short) );
2b30: 0a 20 20 20 20 61 73 73 65 72 74 28 20 21 28 70  .    assert( !(p
2b40: 4d 65 6d 2d 3e 66 6c 61 67 73 26 4d 45 4d 5f 44  Mem->flags&MEM_D
2b50: 79 6e 29 20 7c 7c 20 70 4d 65 6d 2d 3e 78 44 65  yn) || pMem->xDe
2b60: 6c 20 29 3b 0a 20 20 20 20 69 66 28 20 70 4d 65  l );.    if( pMe
2b70: 6d 2d 3e 66 6c 61 67 73 20 26 20 4d 45 4d 5f 44  m->flags & MEM_D
2b80: 79 6e 20 29 7b 0a 20 20 20 20 20 20 76 6f 69 64  yn ){.      void
2b90: 20 28 2a 78 44 65 6c 29 28 76 6f 69 64 2a 29 20   (*xDel)(void*) 
2ba0: 3d 20 70 4d 65 6d 2d 3e 78 44 65 6c 3b 0a 20 20  = pMem->xDel;.  
2bb0: 20 20 20 20 63 68 61 72 20 2a 7a 20 3d 20 70 4d      char *z = pM
2bc0: 65 6d 2d 3e 7a 3b 0a 20 20 20 20 20 20 70 4d 65  em->z;.      pMe
2bd0: 6d 2d 3e 7a 20 3d 20 30 3b 0a 20 20 20 20 20 20  m->z = 0;.      
2be0: 70 4d 65 6d 2d 3e 78 44 65 6c 20 3d 20 30 3b 0a  pMem->xDel = 0;.
2bf0: 20 20 20 20 20 20 72 63 20 3d 20 73 71 6c 69 74        rc = sqlit
2c00: 65 33 56 64 62 65 4d 65 6d 53 65 74 53 74 72 28  e3VdbeMemSetStr(
2c10: 70 4d 65 6d 2c 20 26 7a 5b 32 5d 2c 20 70 4d 65  pMem, &z[2], pMe
2c20: 6d 2d 3e 6e 2d 32 2c 20 62 6f 6d 2c 20 53 51 4c  m->n-2, bom, SQL
2c30: 49 54 45 5f 54 52 41 4e 53 49 45 4e 54 29 3b 0a  ITE_TRANSIENT);.
2c40: 20 20 20 20 20 20 78 44 65 6c 28 7a 29 3b 0a 20        xDel(z);. 
2c50: 20 20 20 7d 65 6c 73 65 7b 0a 20 20 20 20 20 20     }else{.      
2c60: 72 63 20 3d 20 73 71 6c 69 74 65 33 56 64 62 65  rc = sqlite3Vdbe
2c70: 4d 65 6d 53 65 74 53 74 72 28 70 4d 65 6d 2c 20  MemSetStr(pMem, 
2c80: 26 70 4d 65 6d 2d 3e 7a 5b 32 5d 2c 20 70 4d 65  &pMem->z[2], pMe
2c90: 6d 2d 3e 6e 2d 32 2c 20 62 6f 6d 2c 20 0a 20 20  m->n-2, bom, .  
2ca0: 20 20 20 20 20 20 20 20 53 51 4c 49 54 45 5f 54          SQLITE_T
2cb0: 52 41 4e 53 49 45 4e 54 29 3b 0a 20 20 20 20 7d  RANSIENT);.    }
2cc0: 0a 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 72 63  .  }.  return rc
2cd0: 3b 0a 7d 0a 23 65 6e 64 69 66 20 2f 2a 20 53 51  ;.}.#endif /* SQ
2ce0: 4c 49 54 45 5f 4f 4d 49 54 5f 55 54 46 31 36 20  LITE_OMIT_UTF16 
2cf0: 2a 2f 0a 0a 2f 2a 0a 2a 2a 20 70 5a 20 69 73 20  */../*.** pZ is 
2d00: 61 20 55 54 46 2d 38 20 65 6e 63 6f 64 65 64 20  a UTF-8 encoded 
2d10: 75 6e 69 63 6f 64 65 20 73 74 72 69 6e 67 2e 20  unicode string. 
2d20: 49 66 20 6e 42 79 74 65 20 69 73 20 6c 65 73 73  If nByte is less
2d30: 20 74 68 61 6e 20 7a 65 72 6f 2c 0a 2a 2a 20 72   than zero,.** r
2d40: 65 74 75 72 6e 20 74 68 65 20 6e 75 6d 62 65 72  eturn the number
2d50: 20 6f 66 20 75 6e 69 63 6f 64 65 20 63 68 61 72   of unicode char
2d60: 61 63 74 65 72 73 20 69 6e 20 70 5a 20 75 70 20  acters in pZ up 
2d70: 74 6f 20 28 62 75 74 20 6e 6f 74 20 69 6e 63 6c  to (but not incl
2d80: 75 64 69 6e 67 29 0a 2a 2a 20 74 68 65 20 66 69  uding).** the fi
2d90: 72 73 74 20 30 78 30 30 20 62 79 74 65 2e 20 49  rst 0x00 byte. I
2da0: 66 20 6e 42 79 74 65 20 69 73 20 6e 6f 74 20 6c  f nByte is not l
2db0: 65 73 73 20 74 68 61 6e 20 7a 65 72 6f 2c 20 72  ess than zero, r
2dc0: 65 74 75 72 6e 20 74 68 65 0a 2a 2a 20 6e 75 6d  eturn the.** num
2dd0: 62 65 72 20 6f 66 20 75 6e 69 63 6f 64 65 20 63  ber of unicode c
2de0: 68 61 72 61 63 74 65 72 73 20 69 6e 20 74 68 65  haracters in the
2df0: 20 66 69 72 73 74 20 6e 42 79 74 65 20 6f 66 20   first nByte of 
2e00: 70 5a 20 28 6f 72 20 75 70 20 74 6f 20 0a 2a 2a  pZ (or up to .**
2e10: 20 74 68 65 20 66 69 72 73 74 20 30 78 30 30 2c   the first 0x00,
2e20: 20 77 68 69 63 68 65 76 65 72 20 63 6f 6d 65 73   whichever comes
2e30: 20 66 69 72 73 74 29 2e 0a 2a 2f 0a 69 6e 74 20   first)..*/.int 
2e40: 73 71 6c 69 74 65 33 55 74 66 38 43 68 61 72 4c  sqlite3Utf8CharL
2e50: 65 6e 28 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a  en(const char *z
2e60: 49 6e 2c 20 69 6e 74 20 6e 42 79 74 65 29 7b 0a  In, int nByte){.
2e70: 20 20 69 6e 74 20 72 20 3d 20 30 3b 0a 20 20 63    int r = 0;.  c
2e80: 6f 6e 73 74 20 75 38 20 2a 7a 20 3d 20 28 63 6f  onst u8 *z = (co
2e90: 6e 73 74 20 75 38 2a 29 7a 49 6e 3b 0a 20 20 63  nst u8*)zIn;.  c
2ea0: 6f 6e 73 74 20 75 38 20 2a 7a 54 65 72 6d 3b 0a  onst u8 *zTerm;.
2eb0: 20 20 69 66 28 20 6e 42 79 74 65 3e 3d 30 20 29    if( nByte>=0 )
2ec0: 7b 0a 20 20 20 20 7a 54 65 72 6d 20 3d 20 26 7a  {.    zTerm = &z
2ed0: 5b 6e 42 79 74 65 5d 3b 0a 20 20 7d 65 6c 73 65  [nByte];.  }else
2ee0: 7b 0a 20 20 20 20 7a 54 65 72 6d 20 3d 20 28 63  {.    zTerm = (c
2ef0: 6f 6e 73 74 20 75 38 2a 29 28 2d 31 29 3b 0a 20  onst u8*)(-1);. 
2f00: 20 7d 0a 20 20 61 73 73 65 72 74 28 20 7a 3c 3d   }.  assert( z<=
2f10: 7a 54 65 72 6d 20 29 3b 0a 20 20 77 68 69 6c 65  zTerm );.  while
2f20: 28 20 2a 7a 21 3d 30 20 26 26 20 7a 3c 7a 54 65  ( *z!=0 && z<zTe
2f30: 72 6d 20 29 7b 0a 20 20 20 20 53 51 4c 49 54 45  rm ){.    SQLITE
2f40: 5f 53 4b 49 50 5f 55 54 46 38 28 7a 29 3b 0a 20  _SKIP_UTF8(z);. 
2f50: 20 20 20 72 2b 2b 3b 0a 20 20 7d 0a 20 20 72 65     r++;.  }.  re
2f60: 74 75 72 6e 20 72 3b 0a 7d 0a 0a 23 69 66 6e 64  turn r;.}..#ifnd
2f70: 65 66 20 53 51 4c 49 54 45 5f 4f 4d 49 54 5f 55  ef SQLITE_OMIT_U
2f80: 54 46 31 36 0a 2f 2a 0a 2a 2a 20 43 6f 6e 76 65  TF16./*.** Conve
2f90: 72 74 20 61 20 55 54 46 2d 31 36 20 73 74 72 69  rt a UTF-16 stri
2fa0: 6e 67 20 69 6e 20 74 68 65 20 6e 61 74 69 76 65  ng in the native
2fb0: 20 65 6e 63 6f 64 69 6e 67 20 69 6e 74 6f 20 61   encoding into a
2fc0: 20 55 54 46 2d 38 20 73 74 72 69 6e 67 2e 0a 2a   UTF-8 string..*
2fd0: 2a 20 4d 65 6d 6f 72 79 20 74 6f 20 68 6f 6c 64  * Memory to hold
2fe0: 20 74 68 65 20 55 54 46 2d 38 20 73 74 72 69 6e   the UTF-8 strin
2ff0: 67 20 69 73 20 6f 62 74 61 69 6e 65 64 20 66 72  g is obtained fr
3000: 6f 6d 20 6d 61 6c 6c 6f 63 20 61 6e 64 20 6d 75  om malloc and mu
3010: 73 74 20 62 65 0a 2a 2a 20 66 72 65 65 64 20 62  st be.** freed b
3020: 79 20 74 68 65 20 63 61 6c 6c 69 6e 67 20 66 75  y the calling fu
3030: 6e 63 74 69 6f 6e 2e 0a 2a 2a 0a 2a 2a 20 4e 55  nction..**.** NU
3040: 4c 4c 20 69 73 20 72 65 74 75 72 6e 65 64 20 69  LL is returned i
3050: 66 20 74 68 65 72 65 20 69 73 20 61 6e 20 61 6c  f there is an al
3060: 6c 6f 63 61 74 69 6f 6e 20 65 72 72 6f 72 2e 0a  location error..
3070: 2a 2f 0a 63 68 61 72 20 2a 73 71 6c 69 74 65 33  */.char *sqlite3
3080: 55 74 66 31 36 74 6f 38 28 63 6f 6e 73 74 20 76  Utf16to8(const v
3090: 6f 69 64 20 2a 7a 2c 20 69 6e 74 20 6e 42 79 74  oid *z, int nByt
30a0: 65 29 7b 0a 20 20 4d 65 6d 20 6d 3b 0a 20 20 6d  e){.  Mem m;.  m
30b0: 65 6d 73 65 74 28 26 6d 2c 20 30 2c 20 73 69 7a  emset(&m, 0, siz
30c0: 65 6f 66 28 6d 29 29 3b 0a 20 20 73 71 6c 69 74  eof(m));.  sqlit
30d0: 65 33 56 64 62 65 4d 65 6d 53 65 74 53 74 72 28  e3VdbeMemSetStr(
30e0: 26 6d 2c 20 7a 2c 20 6e 42 79 74 65 2c 20 53 51  &m, z, nByte, SQ
30f0: 4c 49 54 45 5f 55 54 46 31 36 4e 41 54 49 56 45  LITE_UTF16NATIVE
3100: 2c 20 53 51 4c 49 54 45 5f 53 54 41 54 49 43 29  , SQLITE_STATIC)
3110: 3b 0a 20 20 73 71 6c 69 74 65 33 56 64 62 65 43  ;.  sqlite3VdbeC
3120: 68 61 6e 67 65 45 6e 63 6f 64 69 6e 67 28 26 6d  hangeEncoding(&m
3130: 2c 20 53 51 4c 49 54 45 5f 55 54 46 38 29 3b 0a  , SQLITE_UTF8);.
3140: 20 20 61 73 73 65 72 74 28 20 28 6d 2e 66 6c 61    assert( (m.fla
3150: 67 73 20 26 20 4d 45 4d 5f 54 65 72 6d 29 21 3d  gs & MEM_Term)!=
3160: 30 20 7c 7c 20 73 71 6c 69 74 65 33 4d 61 6c 6c  0 || sqlite3Mall
3170: 6f 63 46 61 69 6c 65 64 28 29 20 29 3b 0a 20 20  ocFailed() );.  
3180: 61 73 73 65 72 74 28 20 28 6d 2e 66 6c 61 67 73  assert( (m.flags
3190: 20 26 20 4d 45 4d 5f 53 74 72 29 21 3d 30 20 7c   & MEM_Str)!=0 |
31a0: 7c 20 73 71 6c 69 74 65 33 4d 61 6c 6c 6f 63 46  | sqlite3MallocF
31b0: 61 69 6c 65 64 28 29 20 29 3b 0a 20 20 72 65 74  ailed() );.  ret
31c0: 75 72 6e 20 28 6d 2e 66 6c 61 67 73 20 26 20 4d  urn (m.flags & M
31d0: 45 4d 5f 44 79 6e 29 21 3d 30 20 3f 20 6d 2e 7a  EM_Dyn)!=0 ? m.z
31e0: 20 3a 20 73 71 6c 69 74 65 53 74 72 44 75 70 28   : sqliteStrDup(
31f0: 6d 2e 7a 29 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 70  m.z);.}../*.** p
3200: 5a 20 69 73 20 61 20 55 54 46 2d 31 36 20 65 6e  Z is a UTF-16 en
3210: 63 6f 64 65 64 20 75 6e 69 63 6f 64 65 20 73 74  coded unicode st
3220: 72 69 6e 67 2e 20 49 66 20 6e 43 68 61 72 20 69  ring. If nChar i
3230: 73 20 6c 65 73 73 20 74 68 61 6e 20 7a 65 72 6f  s less than zero
3240: 2c 0a 2a 2a 20 72 65 74 75 72 6e 20 74 68 65 20  ,.** return the 
3250: 6e 75 6d 62 65 72 20 6f 66 20 62 79 74 65 73 20  number of bytes 
3260: 75 70 20 74 6f 20 28 62 75 74 20 6e 6f 74 20 69  up to (but not i
3270: 6e 63 6c 75 64 69 6e 67 29 2c 20 74 68 65 20 66  ncluding), the f
3280: 69 72 73 74 20 70 61 69 72 0a 2a 2a 20 6f 66 20  irst pair.** of 
3290: 63 6f 6e 73 65 63 75 74 69 76 65 20 30 78 30 30  consecutive 0x00
32a0: 20 62 79 74 65 73 20 69 6e 20 70 5a 2e 20 49 66   bytes in pZ. If
32b0: 20 6e 43 68 61 72 20 69 73 20 6e 6f 74 20 6c 65   nChar is not le
32c0: 73 73 20 74 68 61 6e 20 7a 65 72 6f 2c 0a 2a 2a  ss than zero,.**
32d0: 20 74 68 65 6e 20 72 65 74 75 72 6e 20 74 68 65   then return the
32e0: 20 6e 75 6d 62 65 72 20 6f 66 20 62 79 74 65 73   number of bytes
32f0: 20 69 6e 20 74 68 65 20 66 69 72 73 74 20 6e 43   in the first nC
3300: 68 61 72 20 75 6e 69 63 6f 64 65 20 63 68 61 72  har unicode char
3310: 61 63 74 65 72 73 0a 2a 2a 20 69 6e 20 70 5a 20  acters.** in pZ 
3320: 28 6f 72 20 75 70 20 75 6e 74 69 6c 20 74 68 65  (or up until the
3330: 20 66 69 72 73 74 20 70 61 69 72 20 6f 66 20 30   first pair of 0
3340: 78 30 30 20 62 79 74 65 73 2c 20 77 68 69 63 68  x00 bytes, which
3350: 65 76 65 72 20 63 6f 6d 65 73 20 66 69 72 73 74  ever comes first
3360: 29 2e 0a 2a 2f 0a 69 6e 74 20 73 71 6c 69 74 65  )..*/.int sqlite
3370: 33 55 74 66 31 36 42 79 74 65 4c 65 6e 28 63 6f  3Utf16ByteLen(co
3380: 6e 73 74 20 76 6f 69 64 20 2a 7a 49 6e 2c 20 69  nst void *zIn, i
3390: 6e 74 20 6e 43 68 61 72 29 7b 0a 20 20 75 6e 73  nt nChar){.  uns
33a0: 69 67 6e 65 64 20 69 6e 74 20 63 20 3d 20 31 3b  igned int c = 1;
33b0: 0a 20 20 63 68 61 72 20 63 6f 6e 73 74 20 2a 7a  .  char const *z
33c0: 20 3d 20 7a 49 6e 3b 0a 20 20 69 6e 74 20 6e 20   = zIn;.  int n 
33d0: 3d 20 30 3b 0a 20 20 69 66 28 20 53 51 4c 49 54  = 0;.  if( SQLIT
33e0: 45 5f 55 54 46 31 36 4e 41 54 49 56 45 3d 3d 53  E_UTF16NATIVE==S
33f0: 51 4c 49 54 45 5f 55 54 46 31 36 42 45 20 29 7b  QLITE_UTF16BE ){
3400: 0a 20 20 20 20 2f 2a 20 55 73 69 6e 67 20 61 6e  .    /* Using an
3410: 20 22 69 66 20 28 53 51 4c 49 54 45 5f 55 54 46   "if (SQLITE_UTF
3420: 31 36 4e 41 54 49 56 45 3d 3d 53 51 4c 49 54 45  16NATIVE==SQLITE
3430: 5f 55 54 46 31 36 42 45 29 22 20 63 6f 6e 73 74  _UTF16BE)" const
3440: 72 75 63 74 20 68 65 72 65 0a 20 20 20 20 2a 2a  ruct here.    **
3450: 20 61 6e 64 20 69 6e 20 6f 74 68 65 72 20 70 61   and in other pa
3460: 72 74 73 20 6f 66 20 74 68 69 73 20 66 69 6c 65  rts of this file
3470: 20 6d 65 61 6e 73 20 74 68 61 74 20 61 74 20 6f   means that at o
3480: 6e 65 20 62 72 61 6e 63 68 20 77 69 6c 6c 0a 20  ne branch will. 
3490: 20 20 20 2a 2a 20 6e 6f 74 20 62 65 20 63 6f 76     ** not be cov
34a0: 65 72 65 64 20 62 79 20 63 6f 76 65 72 61 67 65  ered by coverage
34b0: 20 74 65 73 74 69 6e 67 20 6f 6e 20 61 6e 79 20   testing on any 
34c0: 73 69 6e 67 6c 65 20 68 6f 73 74 2e 20 42 75 74  single host. But
34d0: 20 63 6f 76 65 72 61 67 65 0a 20 20 20 20 2a 2a   coverage.    **
34e0: 20 77 69 6c 6c 20 62 65 20 63 6f 6d 70 6c 65 74   will be complet
34f0: 65 20 69 66 20 74 68 65 20 74 65 73 74 73 20 61  e if the tests a
3500: 72 65 20 72 75 6e 20 6f 6e 20 62 6f 74 68 20 61  re run on both a
3510: 20 6c 69 74 74 6c 65 2d 65 6e 64 69 61 6e 20 61   little-endian a
3520: 6e 64 20 0a 20 20 20 20 2a 2a 20 62 69 67 2d 65  nd .    ** big-e
3530: 6e 64 69 61 6e 20 68 6f 73 74 2e 20 42 65 63 61  ndian host. Beca
3540: 75 73 65 20 62 6f 74 68 20 74 68 65 20 55 54 46  use both the UTF
3550: 31 36 4e 41 54 49 56 45 20 61 6e 64 20 53 51 4c  16NATIVE and SQL
3560: 49 54 45 5f 55 54 46 31 36 42 45 0a 20 20 20 20  ITE_UTF16BE.    
3570: 2a 2a 20 6d 61 63 72 6f 73 20 61 72 65 20 63 6f  ** macros are co
3580: 6e 73 74 61 6e 74 20 61 74 20 63 6f 6d 70 69 6c  nstant at compil
3590: 65 20 74 69 6d 65 20 74 68 65 20 63 6f 6d 70 69  e time the compi
35a0: 6c 65 72 20 63 61 6e 20 64 65 74 65 72 6d 69 6e  ler can determin
35b0: 65 0a 20 20 20 20 2a 2a 20 77 68 69 63 68 20 62  e.    ** which b
35c0: 72 61 6e 63 68 20 77 69 6c 6c 20 62 65 20 66 6f  ranch will be fo
35d0: 6c 6c 6f 77 65 64 2e 20 49 74 20 69 73 20 74 68  llowed. It is th
35e0: 65 72 65 66 6f 72 65 20 61 73 73 75 6d 65 64 20  erefore assumed 
35f0: 74 68 61 74 20 6e 6f 20 72 75 6e 74 69 6d 65 0a  that no runtime.
3600: 20 20 20 20 2a 2a 20 70 65 6e 61 6c 74 79 20 69      ** penalty i
3610: 73 20 70 61 69 64 20 66 6f 72 20 74 68 69 73 20  s paid for this 
3620: 22 69 66 22 20 73 74 61 74 65 6d 65 6e 74 2e 0a  "if" statement..
3630: 20 20 20 20 2a 2f 0a 20 20 20 20 77 68 69 6c 65      */.    while
3640: 28 20 63 20 26 26 20 28 28 6e 43 68 61 72 3c 30  ( c && ((nChar<0
3650: 29 20 7c 7c 20 6e 3c 6e 43 68 61 72 29 20 29 7b  ) || n<nChar) ){
3660: 0a 20 20 20 20 20 20 52 45 41 44 5f 55 54 46 31  .      READ_UTF1
3670: 36 42 45 28 7a 2c 20 63 29 3b 0a 20 20 20 20 20  6BE(z, c);.     
3680: 20 6e 2b 2b 3b 0a 20 20 20 20 7d 0a 20 20 7d 65   n++;.    }.  }e
3690: 6c 73 65 7b 0a 20 20 20 20 77 68 69 6c 65 28 20  lse{.    while( 
36a0: 63 20 26 26 20 28 28 6e 43 68 61 72 3c 30 29 20  c && ((nChar<0) 
36b0: 7c 7c 20 6e 3c 6e 43 68 61 72 29 20 29 7b 0a 20  || n<nChar) ){. 
36c0: 20 20 20 20 20 52 45 41 44 5f 55 54 46 31 36 4c       READ_UTF16L
36d0: 45 28 7a 2c 20 63 29 3b 0a 20 20 20 20 20 20 6e  E(z, c);.      n
36e0: 2b 2b 3b 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20  ++;.    }.  }.  
36f0: 72 65 74 75 72 6e 20 28 7a 2d 28 63 68 61 72 20  return (z-(char 
3700: 63 6f 6e 73 74 20 2a 29 7a 49 6e 29 2d 28 28 63  const *)zIn)-((c
3710: 3d 3d 30 29 3f 32 3a 30 29 3b 0a 7d 0a 0a 23 69  ==0)?2:0);.}..#i
3720: 66 20 64 65 66 69 6e 65 64 28 53 51 4c 49 54 45  f defined(SQLITE
3730: 5f 54 45 53 54 29 0a 2f 2a 0a 2a 2a 20 54 72 61  _TEST)./*.** Tra
3740: 6e 73 6c 61 74 65 20 55 54 46 2d 38 20 74 6f 20  nslate UTF-8 to 
3750: 55 54 46 2d 38 2e 0a 2a 2a 0a 2a 2a 20 54 68 69  UTF-8..**.** Thi
3760: 73 20 68 61 73 20 74 68 65 20 65 66 66 65 63 74  s has the effect
3770: 20 6f 66 20 6d 61 6b 69 6e 67 20 73 75 72 65 20   of making sure 
3780: 74 68 61 74 20 74 68 65 20 73 74 72 69 6e 67 20  that the string 
3790: 69 73 20 77 65 6c 6c 2d 66 6f 72 6d 65 64 0a 2a  is well-formed.*
37a0: 2a 20 55 54 46 2d 38 2e 20 20 4d 69 73 63 6f 64  * UTF-8.  Miscod
37b0: 65 64 20 63 68 61 72 61 63 74 65 72 73 20 61 72  ed characters ar
37c0: 65 20 72 65 6d 6f 76 65 64 2e 0a 2a 2a 0a 2a 2a  e removed..**.**
37d0: 20 54 68 65 20 74 72 61 6e 73 6c 61 74 69 6f 6e   The translation
37e0: 20 69 73 20 64 6f 6e 65 20 69 6e 2d 70 6c 61 63   is done in-plac
37f0: 65 20 28 73 69 6e 63 65 20 69 74 20 69 73 20 69  e (since it is i
3800: 6d 70 6f 73 73 69 62 6c 65 20 66 6f 72 20 74 68  mpossible for th
3810: 65 0a 2a 2a 20 63 6f 72 72 65 63 74 20 55 54 46  e.** correct UTF
3820: 2d 38 20 65 6e 63 6f 64 69 6e 67 20 74 6f 20 62  -8 encoding to b
3830: 65 20 6c 6f 6e 67 65 72 20 74 68 61 6e 20 61 20  e longer than a 
3840: 6d 61 6c 66 6f 72 6d 65 64 20 65 6e 63 6f 64 69  malformed encodi
3850: 6e 67 29 2e 0a 2a 2f 0a 69 6e 74 20 73 71 6c 69  ng)..*/.int sqli
3860: 74 65 33 55 74 66 38 54 6f 38 28 75 6e 73 69 67  te3Utf8To8(unsig
3870: 6e 65 64 20 63 68 61 72 20 2a 7a 49 6e 29 7b 0a  ned char *zIn){.
3880: 20 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20    unsigned char 
3890: 2a 7a 4f 75 74 20 3d 20 7a 49 6e 3b 0a 20 20 75  *zOut = zIn;.  u
38a0: 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 53  nsigned char *zS
38b0: 74 61 72 74 20 3d 20 7a 49 6e 3b 0a 20 20 69 6e  tart = zIn;.  in
38c0: 74 20 63 3b 0a 0a 20 20 77 68 69 6c 65 28 31 29  t c;..  while(1)
38d0: 7b 0a 20 20 20 20 53 51 4c 49 54 45 5f 52 45 41  {.    SQLITE_REA
38e0: 44 5f 55 54 46 38 28 7a 49 6e 2c 20 63 29 3b 0a  D_UTF8(zIn, c);.
38f0: 20 20 20 20 69 66 28 20 63 3d 3d 30 20 29 20 62      if( c==0 ) b
3900: 72 65 61 6b 3b 0a 20 20 20 20 69 66 28 20 63 21  reak;.    if( c!
3910: 3d 30 78 66 66 66 64 20 29 7b 0a 20 20 20 20 20  =0xfffd ){.     
3920: 20 57 52 49 54 45 5f 55 54 46 38 28 7a 4f 75 74   WRITE_UTF8(zOut
3930: 2c 20 63 29 3b 0a 20 20 20 20 7d 0a 20 20 7d 0a  , c);.    }.  }.
3940: 20 20 2a 7a 4f 75 74 20 3d 20 30 3b 0a 20 20 72    *zOut = 0;.  r
3950: 65 74 75 72 6e 20 7a 4f 75 74 20 2d 20 7a 53 74  eturn zOut - zSt
3960: 61 72 74 3b 0a 7d 0a 23 65 6e 64 69 66 0a 0a 23  art;.}.#endif..#
3970: 69 66 20 64 65 66 69 6e 65 64 28 53 51 4c 49 54  if defined(SQLIT
3980: 45 5f 54 45 53 54 29 0a 2f 2a 0a 2a 2a 20 54 68  E_TEST)./*.** Th
3990: 69 73 20 72 6f 75 74 69 6e 65 20 69 73 20 63 61  is routine is ca
39a0: 6c 6c 65 64 20 66 72 6f 6d 20 74 68 65 20 54 43  lled from the TC
39b0: 4c 20 74 65 73 74 20 66 75 6e 63 74 69 6f 6e 20  L test function 
39c0: 22 74 72 61 6e 73 6c 61 74 65 5f 73 65 6c 66 74  "translate_selft
39d0: 65 73 74 22 2e 0a 2a 2a 20 49 74 20 63 68 65 63  est"..** It chec
39e0: 6b 73 20 74 68 61 74 20 74 68 65 20 70 72 69 6d  ks that the prim
39f0: 69 74 69 76 65 73 20 66 6f 72 20 73 65 72 69 61  itives for seria
3a00: 6c 69 7a 69 6e 67 20 61 6e 64 20 64 65 73 65 72  lizing and deser
3a10: 69 61 6c 69 7a 69 6e 67 0a 2a 2a 20 63 68 61 72  ializing.** char
3a20: 61 63 74 65 72 73 20 69 6e 20 65 61 63 68 20 65  acters in each e
3a30: 6e 63 6f 64 69 6e 67 20 61 72 65 20 69 6e 76 65  ncoding are inve
3a40: 72 73 65 73 20 6f 66 20 65 61 63 68 20 6f 74 68  rses of each oth
3a50: 65 72 2e 0a 2a 2f 0a 76 6f 69 64 20 73 71 6c 69  er..*/.void sqli
3a60: 74 65 33 55 74 66 53 65 6c 66 54 65 73 74 28 29  te3UtfSelfTest()
3a70: 7b 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74  {.  unsigned int
3a80: 20 69 2c 20 74 3b 0a 20 20 75 6e 73 69 67 6e 65   i, t;.  unsigne
3a90: 64 20 63 68 61 72 20 7a 42 75 66 5b 32 30 5d 3b  d char zBuf[20];
3aa0: 0a 20 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72  .  unsigned char
3ab0: 20 2a 7a 3b 0a 20 20 69 6e 74 20 6e 3b 0a 20 20   *z;.  int n;.  
3ac0: 75 6e 73 69 67 6e 65 64 20 69 6e 74 20 63 3b 0a  unsigned int c;.
3ad0: 0a 20 20 66 6f 72 28 69 3d 30 3b 20 69 3c 30 78  .  for(i=0; i<0x
3ae0: 30 30 31 31 30 30 30 30 3b 20 69 2b 2b 29 7b 0a  00110000; i++){.
3af0: 20 20 20 20 7a 20 3d 20 7a 42 75 66 3b 0a 20 20      z = zBuf;.  
3b00: 20 20 57 52 49 54 45 5f 55 54 46 38 28 7a 2c 20    WRITE_UTF8(z, 
3b10: 69 29 3b 0a 20 20 20 20 6e 20 3d 20 7a 2d 7a 42  i);.    n = z-zB
3b20: 75 66 3b 0a 20 20 20 20 7a 5b 30 5d 20 3d 20 30  uf;.    z[0] = 0
3b30: 3b 0a 20 20 20 20 7a 20 3d 20 7a 42 75 66 3b 0a  ;.    z = zBuf;.
3b40: 20 20 20 20 53 51 4c 49 54 45 5f 52 45 41 44 5f      SQLITE_READ_
3b50: 55 54 46 38 28 7a 2c 20 63 29 3b 0a 20 20 20 20  UTF8(z, c);.    
3b60: 74 20 3d 20 69 3b 0a 20 20 20 20 69 66 28 20 69  t = i;.    if( i
3b70: 3e 3d 30 78 44 38 30 30 20 26 26 20 69 3c 3d 30  >=0xD800 && i<=0
3b80: 78 44 46 46 46 20 29 20 74 20 3d 20 30 78 46 46  xDFFF ) t = 0xFF
3b90: 46 44 3b 0a 20 20 20 20 69 66 28 20 28 69 26 30  FD;.    if( (i&0
3ba0: 78 46 46 46 46 46 46 46 45 29 3d 3d 30 78 46 46  xFFFFFFFE)==0xFF
3bb0: 46 45 20 29 20 74 20 3d 20 30 78 46 46 46 44 3b  FE ) t = 0xFFFD;
3bc0: 0a 20 20 20 20 61 73 73 65 72 74 28 20 63 3d 3d  .    assert( c==
3bd0: 74 20 29 3b 0a 20 20 20 20 61 73 73 65 72 74 28  t );.    assert(
3be0: 20 28 7a 2d 7a 42 75 66 29 3d 3d 6e 20 29 3b 0a   (z-zBuf)==n );.
3bf0: 20 20 7d 0a 20 20 66 6f 72 28 69 3d 30 3b 20 69    }.  for(i=0; i
3c00: 3c 30 78 30 30 31 31 30 30 30 30 3b 20 69 2b 2b  <0x00110000; i++
3c10: 29 7b 0a 20 20 20 20 69 66 28 20 69 3e 3d 30 78  ){.    if( i>=0x
3c20: 44 38 30 30 20 26 26 20 69 3c 30 78 45 30 30 30  D800 && i<0xE000
3c30: 20 29 20 63 6f 6e 74 69 6e 75 65 3b 0a 20 20 20   ) continue;.   
3c40: 20 7a 20 3d 20 7a 42 75 66 3b 0a 20 20 20 20 57   z = zBuf;.    W
3c50: 52 49 54 45 5f 55 54 46 31 36 4c 45 28 7a 2c 20  RITE_UTF16LE(z, 
3c60: 69 29 3b 0a 20 20 20 20 6e 20 3d 20 7a 2d 7a 42  i);.    n = z-zB
3c70: 75 66 3b 0a 20 20 20 20 7a 5b 30 5d 20 3d 20 30  uf;.    z[0] = 0
3c80: 3b 0a 20 20 20 20 7a 20 3d 20 7a 42 75 66 3b 0a  ;.    z = zBuf;.
3c90: 20 20 20 20 52 45 41 44 5f 55 54 46 31 36 4c 45      READ_UTF16LE
3ca0: 28 7a 2c 20 63 29 3b 0a 20 20 20 20 61 73 73 65  (z, c);.    asse
3cb0: 72 74 28 20 63 3d 3d 69 20 29 3b 0a 20 20 20 20  rt( c==i );.    
3cc0: 61 73 73 65 72 74 28 20 28 7a 2d 7a 42 75 66 29  assert( (z-zBuf)
3cd0: 3d 3d 6e 20 29 3b 0a 20 20 7d 0a 20 20 66 6f 72  ==n );.  }.  for
3ce0: 28 69 3d 30 3b 20 69 3c 30 78 30 30 31 31 30 30  (i=0; i<0x001100
3cf0: 30 30 3b 20 69 2b 2b 29 7b 0a 20 20 20 20 69 66  00; i++){.    if
3d00: 28 20 69 3e 3d 30 78 44 38 30 30 20 26 26 20 69  ( i>=0xD800 && i
3d10: 3c 30 78 45 30 30 30 20 29 20 63 6f 6e 74 69 6e  <0xE000 ) contin
3d20: 75 65 3b 0a 20 20 20 20 7a 20 3d 20 7a 42 75 66  ue;.    z = zBuf
3d30: 3b 0a 20 20 20 20 57 52 49 54 45 5f 55 54 46 31  ;.    WRITE_UTF1
3d40: 36 42 45 28 7a 2c 20 69 29 3b 0a 20 20 20 20 6e  6BE(z, i);.    n
3d50: 20 3d 20 7a 2d 7a 42 75 66 3b 0a 20 20 20 20 7a   = z-zBuf;.    z
3d60: 5b 30 5d 20 3d 20 30 3b 0a 20 20 20 20 7a 20 3d  [0] = 0;.    z =
3d70: 20 7a 42 75 66 3b 0a 20 20 20 20 52 45 41 44 5f   zBuf;.    READ_
3d80: 55 54 46 31 36 42 45 28 7a 2c 20 63 29 3b 0a 20  UTF16BE(z, c);. 
3d90: 20 20 20 61 73 73 65 72 74 28 20 63 3d 3d 69 20     assert( c==i 
3da0: 29 3b 0a 20 20 20 20 61 73 73 65 72 74 28 20 28  );.    assert( (
3db0: 7a 2d 7a 42 75 66 29 3d 3d 6e 20 29 3b 0a 20 20  z-zBuf)==n );.  
3dc0: 7d 0a 7d 0a 23 65 6e 64 69 66 20 2f 2a 20 53 51  }.}.#endif /* SQ
3dd0: 4c 49 54 45 5f 54 45 53 54 20 2a 2f 0a 23 65 6e  LITE_TEST */.#en
3de0: 64 69 66 20 2f 2a 20 53 51 4c 49 54 45 5f 4f 4d  dif /* SQLITE_OM
3df0: 49 54 5f 55 54 46 31 36 20 2a 2f 0a              IT_UTF16 */.