~drizzle-trunk/drizzle/development

« back to all changes in this revision

Viewing changes to sql/rpl_mi.cc

  • Committer: brian
  • Date: 2008-06-25 05:29:13 UTC
  • Revision ID: brian@localhost.localdomain-20080625052913-6upwo0jsrl4lnapl
clean slate

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/* Copyright (C) 2000-2003 MySQL AB
 
2
 
 
3
   This program is free software; you can redistribute it and/or modify
 
4
   it under the terms of the GNU General Public License as published by
 
5
   the Free Software Foundation; version 2 of the License.
 
6
 
 
7
   This program is distributed in the hope that it will be useful,
 
8
   but WITHOUT ANY WARRANTY; without even the implied warranty of
 
9
   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
10
   GNU General Public License for more details.
 
11
 
 
12
   You should have received a copy of the GNU General Public License
 
13
   along with this program; if not, write to the Free Software
 
14
   Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA */
 
15
 
 
16
#include <my_global.h> // For HAVE_REPLICATION
 
17
#include "mysql_priv.h"
 
18
#include <my_dir.h>
 
19
 
 
20
#include "rpl_mi.h"
 
21
 
 
22
#ifdef HAVE_REPLICATION
 
23
 
 
24
#define DEFAULT_CONNECT_RETRY 60
 
25
 
 
26
// Defined in slave.cc
 
27
int init_intvar_from_file(int* var, IO_CACHE* f, int default_val);
 
28
int init_strvar_from_file(char *var, int max_size, IO_CACHE *f,
 
29
                          const char *default_val);
 
30
int init_floatvar_from_file(float* var, IO_CACHE* f, float default_val);
 
31
 
 
32
Master_info::Master_info()
 
33
  :Slave_reporting_capability("I/O"),
 
34
   ssl(0), ssl_verify_server_cert(0), fd(-1),  io_thd(0), port(MYSQL_PORT),
 
35
   connect_retry(DEFAULT_CONNECT_RETRY), heartbeat_period(0),
 
36
   received_heartbeats(0), inited(0),
 
37
   abort_slave(0), slave_running(0), slave_run_id(0)
 
38
{
 
39
  host[0] = 0; user[0] = 0; password[0] = 0;
 
40
  ssl_ca[0]= 0; ssl_capath[0]= 0; ssl_cert[0]= 0;
 
41
  ssl_cipher[0]= 0; ssl_key[0]= 0;
 
42
 
 
43
  bzero((char*) &file, sizeof(file));
 
44
  pthread_mutex_init(&run_lock, MY_MUTEX_INIT_FAST);
 
45
  pthread_mutex_init(&data_lock, MY_MUTEX_INIT_FAST);
 
46
  pthread_cond_init(&data_cond, NULL);
 
47
  pthread_cond_init(&start_cond, NULL);
 
48
  pthread_cond_init(&stop_cond, NULL);
 
49
}
 
50
 
 
51
Master_info::~Master_info()
 
52
{
 
53
  pthread_mutex_destroy(&run_lock);
 
54
  pthread_mutex_destroy(&data_lock);
 
55
  pthread_cond_destroy(&data_cond);
 
56
  pthread_cond_destroy(&start_cond);
 
57
  pthread_cond_destroy(&stop_cond);
 
58
}
 
59
 
 
60
 
 
61
void init_master_log_pos(Master_info* mi)
 
62
{
 
63
  DBUG_ENTER("init_master_log_pos");
 
64
 
 
65
  mi->master_log_name[0] = 0;
 
66
  mi->master_log_pos = BIN_LOG_HEADER_SIZE;             // skip magic number
 
67
  /* 
 
68
    always request heartbeat unless master_heartbeat_period is set
 
69
    explicitly zero.  Here is the default value for heartbeat period
 
70
    if CHANGE MASTER did not specify it.  (no data loss in conversion
 
71
    as hb period has a max)
 
72
  */
 
73
  mi->heartbeat_period= (float) min(SLAVE_MAX_HEARTBEAT_PERIOD,
 
74
                                    (slave_net_timeout/2.0));
 
75
  DBUG_ASSERT(mi->heartbeat_period > (float) 0.001
 
76
              || mi->heartbeat_period == 0);
 
77
  DBUG_VOID_RETURN;
 
78
}
 
79
 
 
80
 
 
81
enum {
 
82
  LINES_IN_MASTER_INFO_WITH_SSL= 14,
 
83
 
 
84
  /* 5.1.16 added value of master_ssl_verify_server_cert */
 
85
  LINE_FOR_MASTER_SSL_VERIFY_SERVER_CERT= 15,
 
86
 
 
87
  /* 6.0 added value of master_heartbeat_period */
 
88
  LINE_FOR_MASTER_HEARTBEAT_PERIOD= 16,
 
89
 
 
90
  /* Number of lines currently used when saving master info file */
 
91
  LINES_IN_MASTER_INFO= LINE_FOR_MASTER_HEARTBEAT_PERIOD
 
92
};
 
93
 
 
94
 
 
95
int init_master_info(Master_info* mi, const char* master_info_fname,
 
96
                     const char* slave_info_fname,
 
97
                     bool abort_if_no_master_info_file,
 
98
                     int thread_mask)
 
99
{
 
100
  int fd,error;
 
101
  char fname[FN_REFLEN+128];
 
102
  DBUG_ENTER("init_master_info");
 
103
 
 
104
  if (mi->inited)
 
105
  {
 
106
    /*
 
107
      We have to reset read position of relay-log-bin as we may have
 
108
      already been reading from 'hotlog' when the slave was stopped
 
109
      last time. If this case pos_in_file would be set and we would
 
110
      get a crash when trying to read the signature for the binary
 
111
      relay log.
 
112
 
 
113
      We only rewind the read position if we are starting the SQL
 
114
      thread. The handle_slave_sql thread assumes that the read
 
115
      position is at the beginning of the file, and will read the
 
116
      "signature" and then fast-forward to the last position read.
 
117
    */
 
118
    if (thread_mask & SLAVE_SQL)
 
119
    {
 
120
      my_b_seek(mi->rli.cur_log, (my_off_t) 0);
 
121
    }
 
122
    DBUG_RETURN(0);
 
123
  }
 
124
 
 
125
  mi->mysql=0;
 
126
  mi->file_id=1;
 
127
  fn_format(fname, master_info_fname, mysql_data_home, "", 4+32);
 
128
 
 
129
  /*
 
130
    We need a mutex while we are changing master info parameters to
 
131
    keep other threads from reading bogus info
 
132
  */
 
133
 
 
134
  pthread_mutex_lock(&mi->data_lock);
 
135
  fd = mi->fd;
 
136
 
 
137
  /* does master.info exist ? */
 
138
 
 
139
  if (access(fname,F_OK))
 
140
  {
 
141
    if (abort_if_no_master_info_file)
 
142
    {
 
143
      pthread_mutex_unlock(&mi->data_lock);
 
144
      DBUG_RETURN(0);
 
145
    }
 
146
    /*
 
147
      if someone removed the file from underneath our feet, just close
 
148
      the old descriptor and re-create the old file
 
149
    */
 
150
    if (fd >= 0)
 
151
      my_close(fd, MYF(MY_WME));
 
152
    if ((fd = my_open(fname, O_CREAT|O_RDWR|O_BINARY, MYF(MY_WME))) < 0 )
 
153
    {
 
154
      sql_print_error("Failed to create a new master info file (file '%s', errno %d)", fname, my_errno);
 
155
      goto err;
 
156
    }
 
157
    if (init_io_cache(&mi->file, fd, IO_SIZE*2, READ_CACHE, 0L,0,
 
158
                      MYF(MY_WME)))
 
159
    {
 
160
      sql_print_error("Failed to create a cache on master info file (file '%s')", fname);
 
161
      goto err;
 
162
    }
 
163
 
 
164
    mi->fd = fd;
 
165
    init_master_log_pos(mi);
 
166
 
 
167
  }
 
168
  else // file exists
 
169
  {
 
170
    if (fd >= 0)
 
171
      reinit_io_cache(&mi->file, READ_CACHE, 0L,0,0);
 
172
    else
 
173
    {
 
174
      if ((fd = my_open(fname, O_RDWR|O_BINARY, MYF(MY_WME))) < 0 )
 
175
      {
 
176
        sql_print_error("Failed to open the existing master info file (file '%s', errno %d)", fname, my_errno);
 
177
        goto err;
 
178
      }
 
179
      if (init_io_cache(&mi->file, fd, IO_SIZE*2, READ_CACHE, 0L,
 
180
                        0, MYF(MY_WME)))
 
181
      {
 
182
        sql_print_error("Failed to create a cache on master info file (file '%s')", fname);
 
183
        goto err;
 
184
      }
 
185
    }
 
186
 
 
187
    mi->fd = fd;
 
188
    int port, connect_retry, master_log_pos, lines;
 
189
    int ssl= 0, ssl_verify_server_cert= 0;
 
190
    float master_heartbeat_period= 0.0;
 
191
    char *first_non_digit;
 
192
 
 
193
    /*
 
194
       Starting from 4.1.x master.info has new format. Now its
 
195
       first line contains number of lines in file. By reading this
 
196
       number we will be always distinguish to which version our
 
197
       master.info corresponds to. We can't simply count lines in
 
198
       file since versions before 4.1.x could generate files with more
 
199
       lines than needed.
 
200
       If first line doesn't contain a number or contain number less than
 
201
       LINES_IN_MASTER_INFO_WITH_SSL then such file is treated like file
 
202
       from pre 4.1.1 version.
 
203
       There is no ambiguity when reading an old master.info, as before
 
204
       4.1.1, the first line contained the binlog's name, which is either
 
205
       empty or has an extension (contains a '.'), so can't be confused
 
206
       with an integer.
 
207
 
 
208
       So we're just reading first line and trying to figure which version
 
209
       is this.
 
210
    */
 
211
 
 
212
    /*
 
213
       The first row is temporarily stored in mi->master_log_name,
 
214
       if it is line count and not binlog name (new format) it will be
 
215
       overwritten by the second row later.
 
216
    */
 
217
    if (init_strvar_from_file(mi->master_log_name,
 
218
                              sizeof(mi->master_log_name), &mi->file,
 
219
                              ""))
 
220
      goto errwithmsg;
 
221
 
 
222
    lines= strtoul(mi->master_log_name, &first_non_digit, 10);
 
223
 
 
224
    if (mi->master_log_name[0]!='\0' &&
 
225
        *first_non_digit=='\0' && lines >= LINES_IN_MASTER_INFO_WITH_SSL)
 
226
    {
 
227
      /* Seems to be new format => read master log name from next line */
 
228
      if (init_strvar_from_file(mi->master_log_name,
 
229
            sizeof(mi->master_log_name), &mi->file, ""))
 
230
        goto errwithmsg;
 
231
    }
 
232
    else
 
233
      lines= 7;
 
234
 
 
235
    if (init_intvar_from_file(&master_log_pos, &mi->file, 4) ||
 
236
        init_strvar_from_file(mi->host, sizeof(mi->host), &mi->file, 0) ||
 
237
        init_strvar_from_file(mi->user, sizeof(mi->user), &mi->file, "test") ||
 
238
        init_strvar_from_file(mi->password, SCRAMBLED_PASSWORD_CHAR_LENGTH+1,
 
239
                              &mi->file, 0 ) ||
 
240
        init_intvar_from_file(&port, &mi->file, MYSQL_PORT) ||
 
241
        init_intvar_from_file(&connect_retry, &mi->file, DEFAULT_CONNECT_RETRY))
 
242
      goto errwithmsg;
 
243
 
 
244
    /*
 
245
      If file has ssl part use it even if we have server without
 
246
      SSL support. But these option will be ignored later when
 
247
      slave will try connect to master, so in this case warning
 
248
      is printed.
 
249
    */
 
250
    if (lines >= LINES_IN_MASTER_INFO_WITH_SSL)
 
251
    {
 
252
      if (init_intvar_from_file(&ssl, &mi->file, 0) ||
 
253
          init_strvar_from_file(mi->ssl_ca, sizeof(mi->ssl_ca),
 
254
                                &mi->file, 0) ||
 
255
          init_strvar_from_file(mi->ssl_capath, sizeof(mi->ssl_capath),
 
256
                                &mi->file, 0) ||
 
257
          init_strvar_from_file(mi->ssl_cert, sizeof(mi->ssl_cert),
 
258
                                &mi->file, 0) ||
 
259
          init_strvar_from_file(mi->ssl_cipher, sizeof(mi->ssl_cipher),
 
260
                                &mi->file, 0) ||
 
261
          init_strvar_from_file(mi->ssl_key, sizeof(mi->ssl_key),
 
262
                               &mi->file, 0))
 
263
      goto errwithmsg;
 
264
 
 
265
      /*
 
266
        Starting from 5.1.16 ssl_verify_server_cert might be
 
267
        in the file
 
268
      */
 
269
      if (lines >= LINE_FOR_MASTER_SSL_VERIFY_SERVER_CERT &&
 
270
          init_intvar_from_file(&ssl_verify_server_cert, &mi->file, 0))
 
271
        goto errwithmsg;
 
272
      /*
 
273
        Starting from 6.0 master_heartbeat_period might be
 
274
        in the file
 
275
      */
 
276
      if (lines >= LINE_FOR_MASTER_HEARTBEAT_PERIOD &&
 
277
          init_floatvar_from_file(&master_heartbeat_period, &mi->file, 0.0))
 
278
        goto errwithmsg;
 
279
    }
 
280
 
 
281
    if (ssl)
 
282
      sql_print_warning("SSL information in the master info file "
 
283
                      "('%s') are ignored because this MySQL slave was "
 
284
                      "compiled without SSL support.", fname);
 
285
 
 
286
    /*
 
287
      This has to be handled here as init_intvar_from_file can't handle
 
288
      my_off_t types
 
289
    */
 
290
    mi->master_log_pos= (my_off_t) master_log_pos;
 
291
    mi->port= (uint) port;
 
292
    mi->connect_retry= (uint) connect_retry;
 
293
    mi->ssl= (my_bool) ssl;
 
294
    mi->ssl_verify_server_cert= ssl_verify_server_cert;
 
295
    mi->heartbeat_period= master_heartbeat_period;
 
296
  }
 
297
  DBUG_PRINT("master_info",("log_file_name: %s  position: %ld",
 
298
                            mi->master_log_name,
 
299
                            (ulong) mi->master_log_pos));
 
300
 
 
301
  mi->rli.mi = mi;
 
302
  if (init_relay_log_info(&mi->rli, slave_info_fname))
 
303
    goto err;
 
304
 
 
305
  mi->inited = 1;
 
306
  // now change cache READ -> WRITE - must do this before flush_master_info
 
307
  reinit_io_cache(&mi->file, WRITE_CACHE, 0L, 0, 1);
 
308
  if ((error=test(flush_master_info(mi, 1))))
 
309
    sql_print_error("Failed to flush master info file");
 
310
  pthread_mutex_unlock(&mi->data_lock);
 
311
  DBUG_RETURN(error);
 
312
 
 
313
errwithmsg:
 
314
  sql_print_error("Error reading master configuration");
 
315
 
 
316
err:
 
317
  if (fd >= 0)
 
318
  {
 
319
    my_close(fd, MYF(0));
 
320
    end_io_cache(&mi->file);
 
321
  }
 
322
  mi->fd= -1;
 
323
  pthread_mutex_unlock(&mi->data_lock);
 
324
  DBUG_RETURN(1);
 
325
}
 
326
 
 
327
 
 
328
/*
 
329
  RETURN
 
330
     2 - flush relay log failed
 
331
     1 - flush master info failed
 
332
     0 - all ok
 
333
*/
 
334
int flush_master_info(Master_info* mi, bool flush_relay_log_cache)
 
335
{
 
336
  IO_CACHE* file = &mi->file;
 
337
  char lbuf[22];
 
338
 
 
339
  DBUG_ENTER("flush_master_info");
 
340
  DBUG_PRINT("enter",("master_pos: %ld", (long) mi->master_log_pos));
 
341
 
 
342
  /*
 
343
    Flush the relay log to disk. If we don't do it, then the relay log while
 
344
    have some part (its last kilobytes) in memory only, so if the slave server
 
345
    dies now, with, say, from master's position 100 to 150 in memory only (not
 
346
    on disk), and with position 150 in master.info, then when the slave
 
347
    restarts, the I/O thread will fetch binlogs from 150, so in the relay log
 
348
    we will have "[0, 100] U [150, infinity[" and nobody will notice it, so the
 
349
    SQL thread will jump from 100 to 150, and replication will silently break.
 
350
 
 
351
    When we come to this place in code, relay log may or not be initialized;
 
352
    the caller is responsible for setting 'flush_relay_log_cache' accordingly.
 
353
  */
 
354
  if (flush_relay_log_cache &&
 
355
      flush_io_cache(mi->rli.relay_log.get_log_file()))
 
356
    DBUG_RETURN(2);
 
357
 
 
358
  /*
 
359
    We flushed the relay log BEFORE the master.info file, because if we crash
 
360
    now, we will get a duplicate event in the relay log at restart. If we
 
361
    flushed in the other order, we would get a hole in the relay log.
 
362
    And duplicate is better than hole (with a duplicate, in later versions we
 
363
    can add detection and scrap one event; with a hole there's nothing we can
 
364
    do).
 
365
  */
 
366
 
 
367
  /*
 
368
     In certain cases this code may create master.info files that seems
 
369
     corrupted, because of extra lines filled with garbage in the end
 
370
     file (this happens if new contents take less space than previous
 
371
     contents of file). But because of number of lines in the first line
 
372
     of file we don't care about this garbage.
 
373
  */
 
374
  char heartbeat_buf[sizeof(mi->heartbeat_period) * 4]; // buffer to suffice always
 
375
  my_sprintf(heartbeat_buf, (heartbeat_buf, "%.3f", mi->heartbeat_period));
 
376
  my_b_seek(file, 0L);
 
377
  my_b_printf(file,
 
378
              "%u\n%s\n%s\n%s\n%s\n%s\n%d\n%d\n%d\n%s\n%s\n%s\n%s\n%s\n%d\n%s\n",
 
379
              LINES_IN_MASTER_INFO,
 
380
              mi->master_log_name, llstr(mi->master_log_pos, lbuf),
 
381
              mi->host, mi->user,
 
382
              mi->password, mi->port, mi->connect_retry,
 
383
              (int)(mi->ssl), mi->ssl_ca, mi->ssl_capath, mi->ssl_cert,
 
384
              mi->ssl_cipher, mi->ssl_key, mi->ssl_verify_server_cert,
 
385
              heartbeat_buf);
 
386
  DBUG_RETURN(-flush_io_cache(file));
 
387
}
 
388
 
 
389
 
 
390
void end_master_info(Master_info* mi)
 
391
{
 
392
  DBUG_ENTER("end_master_info");
 
393
 
 
394
  if (!mi->inited)
 
395
    DBUG_VOID_RETURN;
 
396
  end_relay_log_info(&mi->rli);
 
397
  if (mi->fd >= 0)
 
398
  {
 
399
    end_io_cache(&mi->file);
 
400
    (void)my_close(mi->fd, MYF(MY_WME));
 
401
    mi->fd = -1;
 
402
  }
 
403
  mi->inited = 0;
 
404
 
 
405
  DBUG_VOID_RETURN;
 
406
}
 
407
 
 
408
 
 
409
#endif /* HAVE_REPLICATION */