~drizzle-trunk/drizzle/development

« back to all changes in this revision

Viewing changes to plugin/pbms/src/cslib/CSXML.h

  • Committer: Mark Atwood
  • Date: 2011-12-20 02:32:53 UTC
  • mfrom: (2469.1.1 drizzle-build)
  • Revision ID: me@mark.atwood.name-20111220023253-bvu0kr14kwsdvz7g
mergeĀ lp:~brianaker/drizzle/deprecate-pbms

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
/* Copyright (C) 2010 PrimeBase Technologies GmbH, Germany
2
 
 *
3
 
 * PrimeBase Media Stream for MySQL
4
 
 *
5
 
 * This program is free software; you can redistribute it and/or modify
6
 
 * it under the terms of the GNU General Public License as published by
7
 
 * the Free Software Foundation; either version 2 of the License, or
8
 
 * (at your option) any later version.
9
 
 *
10
 
 * This program is distributed in the hope that it will be useful,
11
 
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
12
 
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13
 
 * GNU General Public License for more details.
14
 
 *
15
 
 * You should have received a copy of the GNU General Public License
16
 
 * along with this program; if not, write to the Free Software
17
 
 * Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA
18
 
 *
19
 
 * Paul McCullagh (H&G2JCtL)
20
 
 *
21
 
 * 2010-01-12
22
 
 *
23
 
 * CORE SYSTEM:
24
 
 * XML Parsing
25
 
 *
26
 
 */
27
 
 
28
 
#include <inttypes.h>
29
 
#include <wchar.h>
30
 
 
31
 
#pragma once
32
 
#ifndef __CSXML_H__
33
 
#define __CSXML_H__
34
 
 
35
 
#define CS_XML_ERR_OUT_OF_MEMORY                -1
36
 
#define CS_XML_ERR_CHAR_TOO_LARGE               -2
37
 
 
38
 
#define CS_XML_EOF_CHAR                                 WCHAR_MAX
39
 
 
40
 
#define CS_MAX_XML_NAME_SIZE                    48
41
 
#define CS_XML_ERR_MSG_SIZE                             128
42
 
 
43
 
/* pxml.h 23.3.01 Paul McCullagh */
44
 
/* Parse XML */
45
 
/* Entities understood by XML:
46
 
   &gt;         (>)
47
 
   &lt;         (<)
48
 
   &amp;        (&)
49
 
   &apos;       (')
50
 
   &quot;       (")
51
 
 
52
 
   Processing Instructions              <? ... ?>
53
 
   CDATA Sections                               <![CDATA[ ... ]]>
54
 
   Document Type Definition             <!DOCTYPE ... [ ...markup... ] >
55
 
   Conditional Sections                 <![ ... [ ...markup... ]]>
56
 
 */
57
 
 
58
 
#define XML_BEFORE_CDATA                                0               /* XXX */
59
 
#define XML_IN_CDATA                                    1               /* XXX */
60
 
 
61
 
#define XML_LT                                                  2               /* < */
62
 
#define XML_LT_BANG                                             3               /* <! */
63
 
#define XML_LT_BANG_DASH                                4               /* <!- */
64
 
#define XML_LT_BANG_SQR                                 5               /* <![ */
65
 
#define XML_LT_BANG_SQR_IN_NAME                 6
66
 
#define XML_LT_BANG_SQR_AFTER_NAME              7
67
 
 
68
 
#define XML_IN_TAG_NAME                                 8               /* abc */
69
 
 
70
 
#define XML_BEFORE_ATTR                                 9               /* ' ' */
71
 
#define XML_IN_ATTR                                             10              /* xyz */
72
 
 
73
 
#define XML_BEFORE_EQUAL                                11              /* ' ' */
74
 
#define XML_AFTER_EQUAL                                 12              /* ' ' */
75
 
 
76
 
#define XML_QUOTE_BEFORE_VALUE                  13              /* " or ' */
77
 
#define XML_IN_VALUE                                    14              /* ... */
78
 
#define XML_QUOTE_AFTER_VALUE                   15              /* " or ' */
79
 
 
80
 
#define XML_SLASH                                               16              /* / */
81
 
#define XML_QMARK                                               17              /* ? */
82
 
#define XML_SQR                                                 18              /* ] */
83
 
 
84
 
#define XML_IN_COMMENT                                  19              /* <!--... */
85
 
#define XML_IN_COMMENT_DASH                             20              /* - */
86
 
#define XML_IN_COMMENT_DASH_DASH                21              /* -- */
87
 
#define XML_IN_COMMENT_3_DASH                   22              /* --- */
88
 
 
89
 
#define XML_IN_CDATA_TAG                                23              /* <![CDATA[... */
90
 
#define XML_IN_CDATA_TAG_SQR                    24              /* ] */
91
 
#define XML_IN_CDATA_TAG_SQR_SQR                25              /* ]] */
92
 
#define XML_IN_CDATA_TAG_3_SQR                  26              /* ]]] */
93
 
 
94
 
#define PARSE_BUFFER_SIZE                               20
95
 
#define PARSE_STACK_SIZE                                200
96
 
 
97
 
#define END_TAG_TYPE(x)                                 (x->nesting-1 < PARSE_STACK_SIZE ? x->end_type[x->nesting-1] : XML_OP_1_END_UNKNOWN_TAG)
98
 
 
99
 
#define TO_LONG_CHAR(ch)                                ((unsigned char) (ch))
100
 
 
101
 
#define XML_STEP_NONE                                   0
102
 
#define XML_STEP_TAG                                    1
103
 
#define XML_STEP_ATTR                                   2
104
 
#define XML_STEP_VALUE                                  3
105
 
#define XML_STEP_NESTED                                 4
106
 
 
107
 
class CSXMLParser {
108
 
        public:
109
 
        CSXMLParser() :
110
 
                state(0),
111
 
                quote(0),
112
 
                step(0),
113
 
                type(0),
114
 
                count(0),
115
 
                nesting(0) {
116
 
        }
117
 
        virtual ~CSXMLParser() { }
118
 
 
119
 
        int32_t parseChar(wchar_t ch);
120
 
        void setDataType(int32_t t) { type = t; }
121
 
        int32_t getDataLen() { return count; }
122
 
        wchar_t *getDataPtr() { return buffer; }
123
 
 
124
 
        private:
125
 
        /* Internal information: */
126
 
        int32_t                 state;
127
 
        int32_t                 quote;
128
 
        int32_t                 step;
129
 
 
130
 
        /* Data: output is always in the buffer: */
131
 
        int32_t                 type;                                                   /* Type of data in the buffer. */
132
 
        int32_t                 count;                                                  /* Size of the buffer.  */
133
 
        wchar_t                 buffer[PARSE_BUFFER_SIZE];              /* Contains data to be added. */
134
 
 
135
 
        /* Signals: tag start and end: */
136
 
        int32_t                 nesting;                                                /* Tag nesting depth. */
137
 
        uint8_t                 end_type[PARSE_STACK_SIZE];             /* Stack of tag types */
138
 
 
139
 
        bool match_string(const char *ch);
140
 
        void increment_nesting(wchar_t ch);
141
 
};
142
 
 
143
 
#define XML_OP_1_MASK                                   0x0000000F
144
 
#define XML_ERROR                                               0x00001000
145
 
 
146
 
#define XML_OP_1_NOOP                                   0x00000000
147
 
#define XML_OP_1_END_TAG                                0x00000001              /* < ... >   */
148
 
#define XML_OP_1_END_CLOSE_TAG                  0x00000002              /* </ ... >  */
149
 
#define XML_OP_1_END_EMPTY_TAG                  0x00000003              /* < ... />  */
150
 
#define XML_OP_1_END_PI_TAG                             0x00000004              /* <? ... ?> */
151
 
#define XML_OP_1_END_ENTITY_TAG                 0x00000005              /* <! ... >  */
152
 
#define XML_OP_1_END_BRACKET_TAG                0x00000006              /* <![ ... ]> */
153
 
#define XML_OP_1_END_UNKNOWN_TAG                0x00000007              /* <_ ... > */
154
 
#define XML_OP_1_START_CDATA_TAG                0x00000008              /* <![CDATA[ ... */
155
 
#define XML_OP_1_START_COMMENT                  0x00000009              /* <!-- ... */
156
 
#define XML_OP_1_START_TAG                              0x0000000A              /* <... */
157
 
#define XML_OP_1_ADD_ATTR                               0x0000000B
158
 
#define XML_OP_1_END_CDATA                              0x0000000C
159
 
#define XML_OP_1_END_CDATA_TAG                  0x0000000D              /* ... ]]> */
160
 
#define XML_OP_1_END_COMMENT                    0x0000000E              /* ... --> */
161
 
 
162
 
#define XML_DATA_MASK                                   0x000000F0
163
 
 
164
 
#define XML_NO_DATA                                             0x00000000
165
 
#define XML_DATA_TAG                                    0x00000010
166
 
#define XML_DATA_ATTR                                   0x00000020
167
 
#define XML_DATA_CDATA                                  0x00000030
168
 
#define XML_DATA_CDATA_TAG                              0x00000040
169
 
#define XML_COMMENT                                             0x00000050
170
 
#define XML_DATA_VALUE                                  0x00000060
171
 
 
172
 
#define XML_OP_2_MASK                                   0x00000F00
173
 
 
174
 
#define XML_OP_2_NOOP                                   0x00000000
175
 
#define XML_OP_2_END_TAG                                0x00000100
176
 
#define XML_OP_2_END_CLOSE_TAG                  0x00000200
177
 
#define XML_OP_2_END_EMPTY_TAG                  0x00000300
178
 
#define XML_OP_2_END_PI_TAG                             0x00000400
179
 
#define XML_OP_2_END_ENTITY_TAG                 0x00000500
180
 
#define XML_OP_2_END_BRACKET_TAG                0x00000600
181
 
#define XML_OP_2_END_UNKNOWN_TAG                0x00000700
182
 
#define XML_OP_2_START_CDATA_TAG                0x00000800
183
 
#define XML_OP_2_START_COMMENT                  0x00000900
184
 
 
185
 
#define XML_noop                                                (XML_OP_2_NOOP|XML_NO_DATA)
186
 
 
187
 
#define XML_CDATA_CH                                    (XML_DATA_CDATA)
188
 
#define XML_end_cdata_TAG_CH                    (XML_OP_1_END_CDATA|XML_DATA_TAG)
189
 
#define XML_start_tag_TAG_CH                    (XML_OP_1_START_TAG|XML_DATA_TAG)
190
 
#define XML_add_attr_TAG_CH                             (XML_OP_1_ADD_ATTR|XML_DATA_TAG)
191
 
#define XML_TAG_CH                                              (XML_DATA_TAG)
192
 
#define XML_start_tag_ATTR_CH                   (XML_OP_1_START_TAG|XML_DATA_ATTR)
193
 
#define XML_add_attr_ATTR_CH                    (XML_OP_1_ADD_ATTR|XML_DATA_ATTR)
194
 
#define XML_ATTR_CH                                             (XML_DATA_ATTR)
195
 
#define XML_start_tag_VALUE_CH                  (XML_OP_1_START_TAG|XML_DATA_VALUE)
196
 
#define XML_add_attr_VALUE_CH                   (XML_OP_1_ADD_ATTR|XML_DATA_VALUE)
197
 
#define XML_VALUE_CH                                    (XML_DATA_VALUE)
198
 
#define XML_start_tag_end_tag(x)                (XML_OP_1_START_TAG|((x) << 8))
199
 
#define XML_add_attr_end_tag(x)                 (XML_OP_1_ADD_ATTR|((x) << 8))
200
 
#define XML_end_tag(x)                                  (x)
201
 
#define XML_start_tag_end_empty_tag             XML_start_tag_end_tag(XML_OP_1_END_EMPTY_TAG)
202
 
#define XML_add_attr_end_empty_tag              XML_add_attr_end_tag(XML_OP_1_END_EMPTY_TAG)
203
 
#define XML_end_empty_tag                               XML_end_tag(XML_OP_1_END_EMPTY_TAG)
204
 
#define XML_start_tag_end_pi_tag                XML_start_tag_end_tag(XML_OP_1_END_PI_TAG)
205
 
#define XML_add_attr_end_pi_tag                 XML_add_attr_end_tag(XML_OP_1_END_PI_TAG)
206
 
#define XML_end_pi_tag                                  XML_end_tag(XML_OP_1_END_PI_TAG)
207
 
 
208
 
#define XML_end_cdata_start_cdata_tag   (XML_OP_1_END_CDATA|XML_OP_2_START_CDATA_TAG)
209
 
#define XML_start_tag_start_cdata_tag   (XML_OP_1_START_TAG|XML_OP_2_START_CDATA_TAG)
210
 
#define XML_add_attr_start_cdata_tag    (XML_OP_1_ADD_ATTR|XML_OP_2_START_CDATA_TAG)
211
 
#define XML_start_cdata_tag                             (XML_OP_1_START_CDATA_TAG)
212
 
#define XML_CDATA_TAG_CH                                (XML_DATA_CDATA_TAG)
213
 
#define XML_end_cdata_tag                               (XML_OP_1_END_CDATA_TAG)
214
 
 
215
 
#define XML_end_cdata_start_comment             (XML_OP_1_END_CDATA|XML_OP_2_START_COMMENT)
216
 
#define XML_start_tag_start_comment             (XML_OP_1_START_TAG|XML_OP_2_START_COMMENT)
217
 
#define XML_add_attr_start_comment              (XML_OP_1_ADD_ATTR|XML_OP_2_START_COMMENT)
218
 
#define XML_start_comment                               (XML_OP_1_START_COMMENT)
219
 
#define XML_COMMENT_CH                                  (XML_COMMENT)
220
 
#define XML_end_comment                                 (XML_OP_1_END_COMMENT)
221
 
 
222
 
/* Standard charsets are ISO-8879-1, US-ASCII or UNICODE. None
223
 
 * require conversion!
224
 
 */
225
 
#define CHARSET_STANDARD                                0
226
 
#define CHARSET_UTF_8                                   1
227
 
#define CHARSET_TO_CONVERT_8_BIT                2
228
 
 
229
 
class CSXMLProcessor : public CSXMLParser {
230
 
        public:
231
 
        CSXMLProcessor() :
232
 
                err_no(0),
233
 
                ip(false),
234
 
                tlength(0),
235
 
                nlength(0),
236
 
                vlength(0),
237
 
                utf8_count(0),
238
 
                utf8_length(0),
239
 
                elength(0) {
240
 
                err_message[0] = 0;
241
 
                charset[0] = 0;
242
 
                pr_tag[0] = 0;
243
 
                pr_name[0] = 0;
244
 
                pr_value[0] = 0;
245
 
                utf8_buffer[0] = 0;
246
 
                entity[0] = 0;
247
 
        }
248
 
        virtual ~CSXMLProcessor() { }
249
 
 
250
 
        /* This function processes a UNICODE character from an XML
251
 
         * document returns parsing instructions (operations).
252
 
         * Each instruction can consist of up to 3 operations. The
253
 
         * operations must be executed in the following order:
254
 
         * - Operation 1
255
 
         * - Data operation, record one of the following:
256
 
         *   - part of a tag name
257
 
         *   - part of an attribute name
258
 
         *   - part of an attribute value
259
 
         *   - part of CDATA
260
 
         * - Operation 2
261
 
         * Output for the data operation (if any) is placed in the buffer
262
 
         * in the state structure. The input state structure must be zeroed
263
 
         * before processing begins. Input characters may be 1 byte or
264
 
         * 2 byte. Output is always 2-byte UNICODE.
265
 
         */
266
 
        int32_t processChar(wchar_t ch);
267
 
 
268
 
        bool getError(int32_t *err, char **msg);
269
 
        void setError(int32_t err, char *msg);
270
 
        void printError(char *prefix);
271
 
 
272
 
        private:
273
 
        int32_t                 err_no;
274
 
        char                    err_message[CS_XML_ERR_MSG_SIZE];
275
 
 
276
 
        private:
277
 
        /* When this function is called, use the name of the charset.
278
 
         * to build the conversion table which maps characters in the
279
 
         * range 128 to 255 to the unicode eqivalent.
280
 
         */
281
 
        virtual bool buildConversionTable();
282
 
 
283
 
        int32_t                 charset_type;
284
 
        char                    charset[CS_MAX_XML_NAME_SIZE];
285
 
        wchar_t                 conversion_table[128];
286
 
 
287
 
        bool                    ip;
288
 
        size_t                  tlength;
289
 
        char                    pr_tag[CS_MAX_XML_NAME_SIZE];
290
 
        size_t                  nlength;
291
 
        char                    pr_name[CS_MAX_XML_NAME_SIZE];
292
 
        size_t                  vlength;
293
 
        char                    pr_value[CS_MAX_XML_NAME_SIZE];
294
 
 
295
 
        int32_t                 utf8_count;
296
 
        int32_t                 utf8_length;
297
 
        uint32_t                utf8_buffer[6];
298
 
 
299
 
        int32_t                 elength;
300
 
        char                    entity[CS_MAX_XML_NAME_SIZE];
301
 
 
302
 
        int32_t capture_initializer(wchar_t ch);
303
 
        int32_t entity_translator(wchar_t ch);
304
 
        int32_t charset_transformer(wchar_t ch);
305
 
        void appendWCharToString(char *dstr, size_t *dlen, size_t dsize, wchar_t *schars, size_t slen);
306
 
};
307
 
 
308
 
/* path is a / separated list of nodes to date. */
309
 
/* Name and path are given in lower-case!!! */
310
 
 
311
 
#define XML_KEEP_EMPTY_CDATA    1
312
 
 
313
 
class CSXMLString {
314
 
        public:
315
 
        CSXMLString() : stringPtr(NULL), stringLen(0), stringSize(0) {}
316
 
        virtual ~CSXMLString() { }
317
 
 
318
 
        public:
319
 
        bool addChar(char ch, CSXMLProcessor *xml);
320
 
        bool addChars(size_t size, wchar_t *buffer, bool to_lower, CSXMLProcessor *xml);
321
 
        bool addString(const char *string, CSXMLProcessor *xml);
322
 
        void setEmpty();
323
 
        void setNull();
324
 
        char *lastComponent();
325
 
        char *findTrailingComponent(const char *comp);
326
 
        void truncate(char *ptr);
327
 
 
328
 
        char                    *stringPtr;
329
 
        size_t                  stringLen;
330
 
        size_t                  stringSize;
331
 
};
332
 
 
333
 
class CSXML : public CSXMLProcessor {
334
 
        public:
335
 
        bool parseXML(int32_t flags);
336
 
 
337
 
        private:
338
 
        /*
339
 
         * Return CS_XML_EOF_CHAR when there are no more characters.
340
 
         */
341
 
        virtual bool getChar(wchar_t *ch) = 0;
342
 
 
343
 
        /*
344
 
         * These methods are called as the input data
345
 
         * is parsed.
346
 
         */
347
 
        virtual bool openNode(char *path, char *value) = 0;
348
 
        virtual bool closeNode(char *path) = 0;
349
 
        virtual bool addAttribute(char *path, char *name, char *value) = 0;
350
 
 
351
 
        private:
352
 
        uint32_t                flags;
353
 
 
354
 
        CSXMLString             xml_path;
355
 
        CSXMLString             xml_name;
356
 
        CSXMLString             xml_value;
357
 
 
358
 
        int32_t nodeType(char *name);
359
 
        bool internalCloseNode(const char *name, bool single);
360
 
        bool internalOpenNode(const char *name);
361
 
};
362
 
 
363
 
class CSXMLPrint : public CSXML {
364
 
        private:
365
 
        virtual bool openNode(char *path, char *value);
366
 
        virtual bool closeNode(char *path);
367
 
        virtual bool addAttribute(char *path, char *name, char *value);
368
 
};
369
 
 
370
 
class CSXMLBuffer : public CSXMLPrint {
371
 
        public:
372
 
        bool parseString(const char *data, int32_t flags);
373
 
        bool parseData(const char *data, size_t len, int32_t flags);
374
 
 
375
 
        private:
376
 
        virtual bool getChar(wchar_t *ch);
377
 
 
378
 
        private:
379
 
        const char              *charData;
380
 
        size_t                  dataLen;
381
 
        size_t                  dataPos;
382
 
};
383
 
 
384
 
class CSXMLFile : public CSXMLPrint {
385
 
        public:
386
 
        bool parseFile(char *file_name, int32_t flags);
387
 
 
388
 
        private:
389
 
        virtual bool getChar(wchar_t *ch);
390
 
 
391
 
        private:
392
 
        char                    *fileName;
393
 
        FILE                    *file;
394
 
};
395
 
 
396
 
#endif