~drizzle-trunk/drizzle/development

« back to all changes in this revision

Viewing changes to plugin/innobase/srv/srv0srv.c

Merge to trunk.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
/*****************************************************************************
2
2
 
3
 
Copyright (C) 1995, 2010, Innobase Oy. All Rights Reserved.
4
 
Copyright (C) 2008, 2009 Google Inc.
5
 
Copyright (C) 2009, Percona Inc.
 
3
Copyright (c) 1995, 2009, Innobase Oy. All Rights Reserved.
 
4
Copyright (c) 2008, 2009 Google Inc.
6
5
 
7
6
Portions of this file contain modifications contributed and copyrighted by
8
7
Google, Inc. Those modifications are gratefully acknowledged and are described
10
9
incorporated with their permission, and subject to the conditions contained in
11
10
the file COPYING.Google.
12
11
 
13
 
Portions of this file contain modifications contributed and copyrighted
14
 
by Percona Inc.. Those modifications are
15
 
gratefully acknowledged and are described briefly in the InnoDB
16
 
documentation. The contributions by Percona Inc. are incorporated with
17
 
their permission, and subject to the conditions contained in the file
18
 
COPYING.Percona.
19
 
 
20
12
This program is free software; you can redistribute it and/or modify it under
21
13
the terms of the GNU General Public License as published by the Free Software
22
14
Foundation; version 2 of the License.
26
18
FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details.
27
19
 
28
20
You should have received a copy of the GNU General Public License along with
29
 
this program; if not, write to the Free Software Foundation, Inc., 51 Franklin
30
 
St, Fifth Floor, Boston, MA 02110-1301 USA
 
21
this program; if not, write to the Free Software Foundation, Inc., 59 Temple
 
22
Place, Suite 330, Boston, MA 02111-1307 USA
31
23
 
32
24
*****************************************************************************/
 
25
/***********************************************************************
 
26
 
 
27
Copyright (c) 1995, 2009, Innobase Oy. All Rights Reserved.
 
28
Copyright (c) 2009, Percona Inc.
 
29
 
 
30
Portions of this file contain modifications contributed and copyrighted
 
31
by Percona Inc.. Those modifications are
 
32
gratefully acknowledged and are described briefly in the InnoDB
 
33
documentation. The contributions by Percona Inc. are incorporated with
 
34
their permission, and subject to the conditions contained in the file
 
35
COPYING.Percona.
 
36
 
 
37
This program is free software; you can redistribute it and/or modify it
 
38
under the terms of the GNU General Public License as published by the
 
39
Free Software Foundation; version 2 of the License.
 
40
 
 
41
This program is distributed in the hope that it will be useful, but
 
42
WITHOUT ANY WARRANTY; without even the implied warranty of
 
43
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General
 
44
Public License for more details.
 
45
 
 
46
You should have received a copy of the GNU General Public License along
 
47
with this program; if not, write to the Free Software Foundation, Inc.,
 
48
59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
 
49
 
 
50
***********************************************************************/
33
51
 
34
52
/**************************************************//**
35
53
@file srv/srv0srv.c
68
86
#include "sync0sync.h"
69
87
#include "thr0loc.h"
70
88
#include "que0que.h"
 
89
#include "srv0que.h"
71
90
#include "log0recv.h"
72
91
#include "pars0pars.h"
73
92
#include "usr0sess.h"
83
102
#include "row0mysql.h"
84
103
#include "ha_prototypes.h"
85
104
#include "trx0i_s.h"
86
 
#include "os0sync.h" /* for HAVE_ATOMIC_BUILTINS */
87
105
 
88
106
/* This is set to TRUE if the MySQL user has set it in MySQL; currently
89
107
affects only FOREIGN KEY definition parsing */
100
118
in microseconds, in order to reduce the lagging of the purge thread. */
101
119
UNIV_INTERN ulint       srv_dml_needed_delay = 0;
102
120
 
103
 
UNIV_INTERN ibool       srv_lock_timeout_active = FALSE;
104
 
UNIV_INTERN ibool       srv_monitor_active = FALSE;
 
121
UNIV_INTERN ibool       srv_lock_timeout_and_monitor_active = FALSE;
105
122
UNIV_INTERN ibool       srv_error_monitor_active = FALSE;
106
123
 
107
124
UNIV_INTERN const char* srv_main_thread_op_info = "";
108
125
 
 
126
/** Prefix used by MySQL to indicate pre-5.1 table name encoding */
 
127
UNIV_INTERN const char  srv_mysql50_table_name_prefix[9] = "#mysql50#";
 
128
 
109
129
/* Server parameters which are read from the initfile */
110
130
 
111
131
/* The following three are dir paths which are catenated before file
124
144
/** Whether to check file format during startup.  A value of
125
145
DICT_TF_FORMAT_MAX + 1 means no checking ie. FALSE.  The default is to
126
146
set it to the highest format we support. */
127
 
UNIV_INTERN ulint       srv_max_file_format_at_startup = DICT_TF_FORMAT_MAX;
 
147
UNIV_INTERN ulint       srv_check_file_format_at_startup = DICT_TF_FORMAT_MAX;
128
148
 
129
149
#if DICT_TF_FORMAT_51
130
150
# error "DICT_TF_FORMAT_51 must be 0!"
133
153
on duplicate key checking and foreign key checking */
134
154
UNIV_INTERN ibool       srv_locks_unsafe_for_binlog = FALSE;
135
155
 
136
 
/* If this flag is TRUE, then we will use the native aio of the
137
 
OS (provided we compiled Innobase with it in), otherwise we will
138
 
use simulated aio we build below with threads.
139
 
Currently we support native aio on windows and linux */
140
 
UNIV_INTERN my_bool     srv_use_native_aio = TRUE;
141
 
 
142
 
#ifdef __WIN__
143
 
/* Windows native condition variables. We use runtime loading / function
144
 
pointers, because they are not available on Windows Server 2003 and
145
 
Windows XP/2000.
146
 
 
147
 
We use condition for events on Windows if possible, even if os_event
148
 
resembles Windows kernel event object well API-wise. The reason is
149
 
performance, kernel objects are heavyweights and WaitForSingleObject() is a
150
 
performance killer causing calling thread to context switch. Besides, Innodb
151
 
is preallocating large number (often millions) of os_events. With kernel event
152
 
objects it takes a big chunk out of non-paged pool, which is better suited
153
 
for tasks like IO than for storing idle event objects. */
154
 
UNIV_INTERN ibool       srv_use_native_conditions = FALSE;
155
 
#endif /* __WIN__ */
156
 
 
157
156
UNIV_INTERN ulint       srv_n_data_files = 0;
158
157
UNIV_INTERN char**      srv_data_file_names = NULL;
159
158
/* size in database pages */
188
187
the checkpoints. */
189
188
UNIV_INTERN bool        srv_adaptive_flushing   = TRUE;
190
189
 
191
 
/** Maximum number of times allowed to conditionally acquire
192
 
mutex before switching to blocking wait on the mutex */
193
 
#define MAX_MUTEX_NOWAIT        20
194
 
 
195
 
/** Check whether the number of failed nonblocking mutex
196
 
acquisition attempts exceeds maximum allowed value. If so,
197
 
srv_printf_innodb_monitor() will request mutex acquisition
198
 
with mutex_enter(), which will wait until it gets the mutex. */
199
 
#define MUTEX_NOWAIT(mutex_skipped)     ((mutex_skipped) < MAX_MUTEX_NOWAIT)
200
 
 
201
 
/** The sort order table of the MySQL latin1_swedish_ci character set
 
190
/* The sort order table of the MySQL latin1_swedish_ci character set
202
191
collation */
203
192
#if defined(BUILD_DRIZZLE)
204
 
const byte      srv_latin1_ordering[256]        /* The sort order table of the latin1
 
193
UNIV_INTERN const byte  srv_latin1_ordering[256]        /* The sort order table of the latin1
205
194
                                        character set. The following table is
206
195
                                        the MySQL order as of Feb 10th, 2002 */
207
196
= {
247
236
UNIV_INTERN my_bool     srv_use_sys_malloc      = TRUE;
248
237
/* requested size in kilobytes */
249
238
UNIV_INTERN ulint       srv_buf_pool_size       = ULINT_MAX;
250
 
/* requested number of buffer pool instances */
251
 
UNIV_INTERN ulint       srv_buf_pool_instances  = 1;
252
239
/* previously requested size */
253
240
UNIV_INTERN ulint       srv_buf_pool_old_size;
254
241
/* current size in kilobytes */
300
287
 
301
288
UNIV_INTERN ulong       srv_max_buf_pool_modified_pct   = 75;
302
289
 
303
 
/* the number of purge threads to use from the worker pool (currently 0 or 1).*/
304
 
UNIV_INTERN ulong srv_n_purge_threads = 0;
305
 
 
306
 
/* the number of records to purge in one batch */
307
 
UNIV_INTERN ulong srv_purge_batch_size = 20;
308
 
 
309
290
/* variable counts amount of data read in total (in bytes) */
310
291
UNIV_INTERN ulint srv_data_read = 0;
311
292
 
352
333
reading of a disk page */
353
334
UNIV_INTERN ulint srv_buf_pool_reads = 0;
354
335
 
 
336
/** Number of sequential read-aheads */
 
337
UNIV_INTERN ulint srv_read_ahead_seq = 0;
 
338
 
 
339
/** Number of random read-aheads */
 
340
UNIV_INTERN ulint srv_read_ahead_rnd = 0;
 
341
 
355
342
/* structure to pass status variables to MySQL */
356
343
UNIV_INTERN export_struc export_vars;
357
344
 
460
447
UNIV_INTERN ib_int64_t  srv_n_lock_wait_time            = 0;
461
448
UNIV_INTERN ulint               srv_n_lock_max_wait_time        = 0;
462
449
 
463
 
UNIV_INTERN ulint               srv_truncated_status_writes     = 0;
464
450
 
465
451
/*
466
452
  Set the following to 0 if you want InnoDB to write messages on
484
470
 
485
471
/* Mutex for locking srv_monitor_file */
486
472
UNIV_INTERN mutex_t     srv_monitor_file_mutex;
487
 
 
488
 
#ifdef UNIV_PFS_MUTEX
489
 
/* Key to register kernel_mutex with performance schema */
490
 
UNIV_INTERN mysql_pfs_key_t     kernel_mutex_key;
491
 
/* Key to protect writing the commit_id to the sys header */
492
 
UNIV_INTERN mysql_pfs_key_t     commit_id_mutex_key;
493
 
/* Key to register srv_innodb_monitor_mutex with performance schema */
494
 
UNIV_INTERN mysql_pfs_key_t     srv_innodb_monitor_mutex_key;
495
 
/* Key to register srv_monitor_file_mutex with performance schema */
496
 
UNIV_INTERN mysql_pfs_key_t     srv_monitor_file_mutex_key;
497
 
/* Key to register srv_dict_tmpfile_mutex with performance schema */
498
 
UNIV_INTERN mysql_pfs_key_t     srv_dict_tmpfile_mutex_key;
499
 
/* Key to register the mutex with performance schema */
500
 
UNIV_INTERN mysql_pfs_key_t     srv_misc_tmpfile_mutex_key;
501
 
#endif /* UNIV_PFS_MUTEX */
502
 
 
503
473
/* Temporary file for innodb monitor output */
504
474
UNIV_INTERN FILE*       srv_monitor_file;
505
475
/* Mutex for locking srv_dict_tmpfile.
532
502
static ulint   srv_main_flush_loops             = 0;
533
503
/* Log writes involving flush. */
534
504
static ulint   srv_log_writes_and_flush         = 0;
 
505
/* Log writes not including flush. */
 
506
static ulint   srv_log_buffer_writes            = 0;
535
507
 
536
508
/* This is only ever touched by the master thread. It records the
537
509
time when the last flush of log file has happened. The master
733
705
/* Table for MySQL threads where they will be suspended to wait for locks */
734
706
UNIV_INTERN srv_slot_t* srv_mysql_table = NULL;
735
707
 
736
 
UNIV_INTERN os_event_t  srv_timeout_event;
737
 
 
738
 
UNIV_INTERN os_event_t  srv_monitor_event;
739
 
 
740
 
UNIV_INTERN os_event_t  srv_error_event;
741
 
 
742
708
UNIV_INTERN os_event_t  srv_lock_timeout_thread_event;
743
709
 
744
710
UNIV_INTERN srv_sys_t*  srv_sys = NULL;
748
714
UNIV_INTERN byte        srv_pad1[64];
749
715
/* mutex protecting the server, trx structs, query threads, and lock table */
750
716
UNIV_INTERN mutex_t*    kernel_mutex_temp;
751
 
/* mutex protecting the sys header for writing the commit id */
752
 
UNIV_INTERN mutex_t*    commit_id_mutex_temp;
753
 
 
754
717
/* padding to prevent other memory update hotspots from residing on
755
718
the same memory cache line */
756
719
UNIV_INTERN byte        srv_pad2[64];
769
732
static ulint    srv_meter_foreground[SRV_MASTER + 1];
770
733
#endif
771
734
 
 
735
/* The following values give info about the activity going on in
 
736
the database. They are protected by the server mutex. The arrays
 
737
are indexed by the type of the thread. */
 
738
 
 
739
UNIV_INTERN ulint       srv_n_threads_active[SRV_MASTER + 1];
 
740
UNIV_INTERN ulint       srv_n_threads[SRV_MASTER + 1];
 
741
 
772
742
/***********************************************************************
773
743
Prints counters for work done by srv_master_thread. */
774
744
static
782
752
                srv_main_1_second_loops, srv_main_sleeps,
783
753
                srv_main_10_second_loops, srv_main_background_loops,
784
754
                srv_main_flush_loops);
785
 
        fprintf(file, "srv_master_thread log flush and writes: %lu\n",
786
 
                      srv_log_writes_and_flush);
 
755
        fprintf(file, "srv_master_thread log flush and writes: %lu "
 
756
                      " log writes only: %lu\n",
 
757
                      srv_log_writes_and_flush, srv_log_buffer_writes);
787
758
}
788
759
 
789
 
/* The following values give info about the activity going on in
790
 
the database. They are protected by the server mutex. The arrays
791
 
are indexed by the type of the thread. */
792
 
 
793
 
UNIV_INTERN ulint       srv_n_threads_active[SRV_MASTER + 1];
794
 
UNIV_INTERN ulint       srv_n_threads[SRV_MASTER + 1];
795
 
 
796
760
/*********************************************************************//**
797
761
Sets the info describing an i/o thread current state. */
798
762
UNIV_INTERN
912
876
 
913
877
        slot = srv_table_get_nth_slot(slot_no);
914
878
 
915
 
        type = static_cast<srv_thread_type>(slot->type);
 
879
        type = slot->type;
916
880
 
917
881
        ut_ad(type >= SRV_WORKER);
918
882
        ut_ad(type <= SRV_MASTER);
955
919
 
956
920
                slot = srv_table_get_nth_slot(i);
957
921
 
958
 
                if (slot->in_use &&
959
 
                    (static_cast<srv_thread_type>(slot->type) == type) &&
960
 
                    slot->suspended) {
 
922
                if (slot->in_use && slot->type == type && slot->suspended) {
961
923
 
962
924
                        slot->suspended = FALSE;
963
925
 
1002
964
 
1003
965
        slot = srv_table_get_nth_slot(slot_no);
1004
966
 
1005
 
        type = static_cast<srv_thread_type>(slot->type);
 
967
        type = slot->type;
1006
968
 
1007
969
        ut_ad(type >= SRV_WORKER);
1008
970
        ut_ad(type <= SRV_MASTER);
1023
985
        srv_slot_t*             slot;
1024
986
        ulint                   i;
1025
987
 
1026
 
        srv_sys = static_cast<srv_sys_t *>(mem_alloc(sizeof(srv_sys_t)));
1027
 
 
1028
 
        kernel_mutex_temp = static_cast<ib_mutex_t *>(mem_alloc(sizeof(mutex_t)));
1029
 
        mutex_create(kernel_mutex_key, &kernel_mutex, SYNC_KERNEL);
1030
 
 
1031
 
        commit_id_mutex_temp = static_cast<ib_mutex_t *>(mem_alloc(sizeof(mutex_t)));
1032
 
        mutex_create(commit_id_mutex_key, &commit_id_mutex, SYNC_COMMIT_ID_LOCK);
1033
 
 
1034
 
        mutex_create(srv_innodb_monitor_mutex_key,
1035
 
                     &srv_innodb_monitor_mutex, SYNC_NO_ORDER_CHECK);
1036
 
 
1037
 
        srv_sys->threads = static_cast<srv_table_t *>(mem_alloc(OS_THREAD_MAX_N * sizeof(srv_slot_t)));
 
988
        srv_sys = mem_alloc(sizeof(srv_sys_t));
 
989
 
 
990
        kernel_mutex_temp = mem_alloc(sizeof(mutex_t));
 
991
        mutex_create(&kernel_mutex, SYNC_KERNEL);
 
992
 
 
993
        mutex_create(&srv_innodb_monitor_mutex, SYNC_NO_ORDER_CHECK);
 
994
 
 
995
        srv_sys->threads = mem_alloc(OS_THREAD_MAX_N * sizeof(srv_slot_t));
1038
996
 
1039
997
        for (i = 0; i < OS_THREAD_MAX_N; i++) {
1040
998
                slot = srv_table_get_nth_slot(i);
1044
1002
                ut_a(slot->event);
1045
1003
        }
1046
1004
 
1047
 
        srv_mysql_table = static_cast<srv_slot_t *>(mem_alloc(OS_THREAD_MAX_N * sizeof(srv_slot_t)));
 
1005
        srv_mysql_table = mem_alloc(OS_THREAD_MAX_N * sizeof(srv_slot_t));
1048
1006
 
1049
1007
        for (i = 0; i < OS_THREAD_MAX_N; i++) {
1050
1008
                slot = srv_mysql_table + i;
1054
1012
                ut_a(slot->event);
1055
1013
        }
1056
1014
 
1057
 
        srv_error_event = os_event_create(NULL);
1058
 
 
1059
 
        srv_timeout_event = os_event_create(NULL);
1060
 
 
1061
 
        srv_monitor_event = os_event_create(NULL);
1062
 
 
1063
1015
        srv_lock_timeout_thread_event = os_event_create(NULL);
1064
1016
 
1065
1017
        for (i = 0; i < SRV_MASTER + 1; i++) {
1086
1038
 
1087
1039
        UT_LIST_INIT(srv_conc_queue);
1088
1040
 
1089
 
        srv_conc_slots = static_cast<srv_conc_slot_t *>(mem_alloc(OS_THREAD_MAX_N * sizeof(srv_conc_slot_t)));
 
1041
        srv_conc_slots = mem_alloc(OS_THREAD_MAX_N * sizeof(srv_conc_slot_t));
1090
1042
 
1091
1043
        for (i = 0; i < OS_THREAD_MAX_N; i++) {
1092
1044
                conc_slot = srv_conc_slots + i;
1100
1052
}
1101
1053
 
1102
1054
/*********************************************************************//**
1103
 
Frees the data structures created in srv_init(). */
 
1055
Frees the OS fast mutex created in srv_init(). */
1104
1056
UNIV_INTERN
1105
1057
void
1106
1058
srv_free(void)
1107
1059
/*==========*/
1108
1060
{
1109
1061
        os_fast_mutex_free(&srv_conc_mutex);
1110
 
        mem_free(srv_conc_slots);
1111
 
        srv_conc_slots = NULL;
1112
 
 
1113
 
        mem_free(srv_sys->threads);
1114
 
        mem_free(srv_sys);
1115
 
        srv_sys = NULL;
1116
 
 
1117
 
        mem_free(kernel_mutex_temp);
1118
 
        kernel_mutex_temp = NULL;
1119
 
        mem_free(srv_mysql_table);
1120
 
        srv_mysql_table = NULL;
1121
 
 
1122
 
        mem_free(commit_id_mutex_temp);
1123
 
        commit_id_mutex_temp = NULL;
1124
 
 
1125
 
        trx_i_s_cache_free(trx_i_s_cache);
1126
1062
}
1127
1063
 
1128
1064
/*********************************************************************//**
1134
1070
/*==================*/
1135
1071
{
1136
1072
        ut_mem_init();
1137
 
        /* Reset the system variables in the recovery module. */
1138
 
        recv_sys_var_init();
1139
1073
        os_sync_init();
1140
1074
        sync_init();
1141
1075
        mem_init(srv_mem_pool_size);
1642
1576
                row_mysql_unfreeze_data_dictionary(trx);
1643
1577
                break;
1644
1578
        case RW_X_LATCH:
1645
 
                /* There should never be a lock wait when the
1646
 
                dictionary latch is reserved in X mode.  Dictionary
1647
 
                transactions should only acquire locks on dictionary
1648
 
                tables, not other tables. All access to dictionary
1649
 
                tables should be covered by dictionary
1650
 
                transactions. */
1651
 
                ut_print_timestamp(stderr);
1652
 
                fputs("  InnoDB: Error: dict X latch held in "
1653
 
                      "srv_suspend_mysql_thread\n", stderr);
1654
 
                /* This should never occur. This incorrect handling
1655
 
                was added in the early development of
1656
 
                ha_innobase::add_index() in InnoDB Plugin 1.0. */
1657
1579
                /* Release fast index creation latch */
1658
1580
                row_mysql_unlock_data_dictionary(trx);
1659
1581
                break;
1673
1595
                row_mysql_freeze_data_dictionary(trx);
1674
1596
                break;
1675
1597
        case RW_X_LATCH:
1676
 
                /* This should never occur. This incorrect handling
1677
 
                was added in the early development of
1678
 
                ha_innobase::add_index() in InnoDB Plugin 1.0. */
1679
1598
                row_mysql_lock_data_dictionary(trx);
1680
1599
                break;
1681
1600
        }
1712
1631
                    start_time != -1 && finish_time != -1) {
1713
1632
                        srv_n_lock_max_wait_time = diff_time;
1714
1633
                }
1715
 
 
1716
 
                /* Record the lock wait time for this thread */
1717
 
                thd_set_lock_wait_time(trx->mysql_thd, diff_time);
1718
1634
        }
1719
1635
 
1720
1636
        if (trx->was_chosen_as_deadlock_victim) {
1736
1652
 
1737
1653
                trx->error_state = DB_LOCK_WAIT_TIMEOUT;
1738
1654
        }
1739
 
 
1740
 
        if (trx_is_interrupted(trx)) {
1741
 
 
1742
 
                trx->error_state = DB_INTERRUPTED;
1743
 
        }
1744
1655
}
1745
1656
 
1746
1657
/********************************************************************//**
1792
1703
 
1793
1704
        log_refresh_stats();
1794
1705
 
1795
 
        buf_refresh_io_stats_all();
 
1706
        buf_refresh_io_stats();
1796
1707
 
1797
1708
        srv_n_rows_inserted_old = srv_n_rows_inserted;
1798
1709
        srv_n_rows_updated_old = srv_n_rows_updated;
1803
1714
}
1804
1715
 
1805
1716
/******************************************************************//**
1806
 
Outputs to a file the output of the InnoDB Monitor.
1807
 
@return FALSE if not all information printed
1808
 
due to failure to obtain necessary mutex */
 
1717
Outputs to a file the output of the InnoDB Monitor. */
1809
1718
UNIV_INTERN
1810
 
ibool
 
1719
void
1811
1720
srv_printf_innodb_monitor(
1812
1721
/*======================*/
1813
1722
        FILE*   file,           /*!< in: output stream */
1814
 
        ibool   nowait,         /*!< in: whether to wait for kernel mutex */
1815
1723
        ulint*  trx_start,      /*!< out: file position of the start of
1816
1724
                                the list of active transactions */
1817
1725
        ulint*  trx_end)        /*!< out: file position of the end of
1820
1728
        double  time_elapsed;
1821
1729
        time_t  current_time;
1822
1730
        ulint   n_reserved;
1823
 
        ibool   ret;
1824
1731
 
1825
1732
        mutex_enter(&srv_innodb_monitor_mutex);
1826
1733
 
1844
1751
                "Per second averages calculated from the last %lu seconds\n",
1845
1752
                (ulong)time_elapsed);
1846
1753
 
1847
 
        fputs("-----------------\n"
1848
 
              "BACKGROUND THREAD\n"
1849
 
              "-----------------\n", file);
 
1754
        fputs("----------\n"
 
1755
                "BACKGROUND THREAD\n"
 
1756
                "----------\n", file);
1850
1757
        srv_print_master_thread_info(file);
1851
1758
 
1852
1759
        fputs("----------\n"
1870
1777
 
1871
1778
        mutex_exit(&dict_foreign_err_mutex);
1872
1779
 
1873
 
        /* Only if lock_print_info_summary proceeds correctly,
1874
 
        before we call the lock_print_info_all_transactions
1875
 
        to print all the lock information. */
1876
 
        ret = lock_print_info_summary(file, nowait);
1877
 
 
1878
 
        if (ret) {
1879
 
                if (trx_start) {
1880
 
                        long    t = ftell(file);
1881
 
                        if (t < 0) {
1882
 
                                *trx_start = ULINT_UNDEFINED;
1883
 
                        } else {
1884
 
                                *trx_start = (ulint) t;
1885
 
                        }
1886
 
                }
1887
 
                lock_print_info_all_transactions(file);
1888
 
                if (trx_end) {
1889
 
                        long    t = ftell(file);
1890
 
                        if (t < 0) {
1891
 
                                *trx_end = ULINT_UNDEFINED;
1892
 
                        } else {
1893
 
                                *trx_end = (ulint) t;
1894
 
                        }
1895
 
                }
1896
 
        }
1897
 
 
 
1780
        lock_print_info_summary(file);
 
1781
        if (trx_start) {
 
1782
                long    t = ftell(file);
 
1783
                if (t < 0) {
 
1784
                        *trx_start = ULINT_UNDEFINED;
 
1785
                } else {
 
1786
                        *trx_start = (ulint) t;
 
1787
                }
 
1788
        }
 
1789
        lock_print_info_all_transactions(file);
 
1790
        if (trx_end) {
 
1791
                long    t = ftell(file);
 
1792
                if (t < 0) {
 
1793
                        *trx_end = ULINT_UNDEFINED;
 
1794
                } else {
 
1795
                        *trx_end = (ulint) t;
 
1796
                }
 
1797
        }
1898
1798
        fputs("--------\n"
1899
1799
              "FILE I/O\n"
1900
1800
              "--------\n", file);
1942
1842
                (ulong) srv_conc_n_waiting_threads);
1943
1843
 
1944
1844
        fprintf(file, "%lu read views open inside InnoDB\n",
1945
 
                static_cast<ulint>(UT_LIST_GET_LEN(trx_sys->view_list)));
 
1845
                UT_LIST_GET_LEN(trx_sys->view_list));
1946
1846
 
1947
1847
        n_reserved = fil_space_get_n_reserved_extents(0);
1948
1848
        if (n_reserved > 0) {
1992
1892
              "============================\n", file);
1993
1893
        mutex_exit(&srv_innodb_monitor_mutex);
1994
1894
        fflush(file);
1995
 
 
1996
 
        return(ret);
1997
1895
}
1998
1896
 
1999
1897
/******************************************************************//**
2003
1901
srv_export_innodb_status(void)
2004
1902
/*==========================*/
2005
1903
{
2006
 
        buf_pool_stat_t stat;
2007
 
        ulint           LRU_len;
2008
 
        ulint           free_len;
2009
 
        ulint           flush_list_len;
2010
 
 
2011
 
        buf_get_total_stat(&stat);
2012
 
        buf_get_total_list_len(&LRU_len, &free_len, &flush_list_len);
2013
 
 
2014
1904
        mutex_enter(&srv_innodb_monitor_mutex);
2015
1905
 
2016
1906
        export_vars.innodb_data_pending_reads
2025
1915
        export_vars.innodb_data_reads = os_n_file_reads;
2026
1916
        export_vars.innodb_data_writes = os_n_file_writes;
2027
1917
        export_vars.innodb_data_written = srv_data_written;
2028
 
        export_vars.innodb_buffer_pool_read_requests = stat.n_page_gets;
 
1918
        export_vars.innodb_buffer_pool_read_requests = buf_pool->n_page_gets;
2029
1919
        export_vars.innodb_buffer_pool_write_requests
2030
1920
                = srv_buf_pool_write_requests;
2031
1921
        export_vars.innodb_buffer_pool_wait_free = srv_buf_pool_wait_free;
2032
1922
        export_vars.innodb_buffer_pool_pages_flushed = srv_buf_pool_flushed;
2033
1923
        export_vars.innodb_buffer_pool_reads = srv_buf_pool_reads;
2034
 
        export_vars.innodb_buffer_pool_read_ahead
2035
 
                = stat.n_ra_pages_read;
2036
 
        export_vars.innodb_buffer_pool_read_ahead_evicted
2037
 
                = stat.n_ra_pages_evicted;
2038
 
        export_vars.innodb_buffer_pool_pages_data = LRU_len;
2039
 
        export_vars.innodb_buffer_pool_pages_dirty = flush_list_len;
2040
 
        export_vars.innodb_buffer_pool_pages_free = free_len;
 
1924
        export_vars.innodb_buffer_pool_read_ahead_rnd = srv_read_ahead_rnd;
 
1925
        export_vars.innodb_buffer_pool_read_ahead_seq = srv_read_ahead_seq;
 
1926
        export_vars.innodb_buffer_pool_pages_data
 
1927
                = UT_LIST_GET_LEN(buf_pool->LRU);
 
1928
        export_vars.innodb_buffer_pool_pages_dirty
 
1929
                = UT_LIST_GET_LEN(buf_pool->flush_list);
 
1930
        export_vars.innodb_buffer_pool_pages_free
 
1931
                = UT_LIST_GET_LEN(buf_pool->free);
2041
1932
#ifdef UNIV_DEBUG
2042
1933
        export_vars.innodb_buffer_pool_pages_latched
2043
1934
                = buf_get_latched_pages_number();
2044
1935
#endif /* UNIV_DEBUG */
2045
 
        export_vars.innodb_buffer_pool_pages_total = buf_pool_get_n_pages();
 
1936
        export_vars.innodb_buffer_pool_pages_total = buf_pool->curr_size;
2046
1937
 
2047
 
        export_vars.innodb_buffer_pool_pages_misc
2048
 
                = buf_pool_get_n_pages() - LRU_len - free_len;
 
1938
        export_vars.innodb_buffer_pool_pages_misc = buf_pool->curr_size
 
1939
                - UT_LIST_GET_LEN(buf_pool->LRU)
 
1940
                - UT_LIST_GET_LEN(buf_pool->free);
2049
1941
#ifdef HAVE_ATOMIC_BUILTINS
2050
1942
        export_vars.innodb_have_atomic_builtins = 1;
2051
1943
#else
2061
1953
        export_vars.innodb_log_writes = srv_log_writes;
2062
1954
        export_vars.innodb_dblwr_pages_written = srv_dblwr_pages_written;
2063
1955
        export_vars.innodb_dblwr_writes = srv_dblwr_writes;
2064
 
        export_vars.innodb_pages_created = stat.n_pages_created;
2065
 
        export_vars.innodb_pages_read = stat.n_pages_read;
2066
 
        export_vars.innodb_pages_written = stat.n_pages_written;
 
1956
        export_vars.innodb_pages_created = buf_pool->n_pages_created;
 
1957
        export_vars.innodb_pages_read = buf_pool->n_pages_read;
 
1958
        export_vars.innodb_pages_written = buf_pool->n_pages_written;
2067
1959
        export_vars.innodb_row_lock_waits = srv_n_lock_wait_count;
2068
1960
        export_vars.innodb_row_lock_current_waits
2069
1961
                = srv_n_lock_wait_current_count;
2080
1972
        export_vars.innodb_rows_inserted = srv_n_rows_inserted;
2081
1973
        export_vars.innodb_rows_updated = srv_n_rows_updated;
2082
1974
        export_vars.innodb_rows_deleted = srv_n_rows_deleted;
2083
 
        export_vars.innodb_truncated_status_writes = srv_truncated_status_writes;
2084
1975
 
2085
1976
        mutex_exit(&srv_innodb_monitor_mutex);
2086
1977
}
2087
1978
 
2088
1979
/*********************************************************************//**
2089
 
A thread which prints the info output by various InnoDB monitors.
 
1980
A thread which wakes up threads whose lock wait may have lasted too long.
 
1981
This also prints the info output by various InnoDB monitors.
2090
1982
@return a dummy parameter */
2091
1983
UNIV_INTERN
2092
1984
os_thread_ret_t
2093
 
srv_monitor_thread(
2094
 
/*===============*/
2095
 
        void*   /*arg __attribute__((unused))*/)
 
1985
srv_lock_timeout_and_monitor_thread(
 
1986
/*================================*/
 
1987
        void*   arg __attribute__((unused)))
2096
1988
                        /*!< in: a dummy parameter required by
2097
1989
                        os_thread_create */
2098
1990
{
2099
 
        ib_int64_t      sig_count;
 
1991
        srv_slot_t*     slot;
2100
1992
        double          time_elapsed;
2101
1993
        time_t          current_time;
2102
1994
        time_t          last_table_monitor_time;
2103
1995
        time_t          last_tablespace_monitor_time;
2104
1996
        time_t          last_monitor_time;
2105
 
        ulint           mutex_skipped;
2106
 
        ibool           last_srv_print_monitor;
 
1997
        ibool           some_waits;
 
1998
        double          wait_time;
 
1999
        ulint           i;
2107
2000
 
2108
2001
#ifdef UNIV_DEBUG_THREAD_CREATION
2109
2002
        fprintf(stderr, "Lock timeout thread starts, id %lu\n",
2110
2003
                os_thread_pf(os_thread_get_curr_id()));
2111
2004
#endif
2112
 
 
2113
 
#ifdef UNIV_PFS_THREAD
2114
 
        pfs_register_thread(srv_monitor_thread_key);
2115
 
#endif
2116
 
 
2117
 
        srv_last_monitor_time = ut_time();
2118
 
        last_table_monitor_time = ut_time();
2119
 
        last_tablespace_monitor_time = ut_time();
2120
 
        last_monitor_time = ut_time();
2121
 
        mutex_skipped = 0;
2122
 
        last_srv_print_monitor = srv_print_innodb_monitor;
 
2005
        UT_NOT_USED(arg);
 
2006
        srv_last_monitor_time = time(NULL);
 
2007
        last_table_monitor_time = time(NULL);
 
2008
        last_tablespace_monitor_time = time(NULL);
 
2009
        last_monitor_time = time(NULL);
2123
2010
loop:
2124
 
        srv_monitor_active = TRUE;
2125
 
 
2126
 
        /* Wake up every 5 seconds to see if we need to print
2127
 
        monitor information or if signalled at shutdown. */
2128
 
 
2129
 
        sig_count = os_event_reset(srv_monitor_event);
2130
 
 
2131
 
        os_event_wait_time_low(srv_monitor_event, 5000000, sig_count);
2132
 
 
2133
 
        current_time = ut_time();
 
2011
        srv_lock_timeout_and_monitor_active = TRUE;
 
2012
 
 
2013
        /* When someone is waiting for a lock, we wake up every second
 
2014
        and check if a timeout has passed for a lock wait */
 
2015
 
 
2016
        os_thread_sleep(1000000);
 
2017
 
 
2018
        current_time = time(NULL);
2134
2019
 
2135
2020
        time_elapsed = difftime(current_time, last_monitor_time);
2136
2021
 
2137
2022
        if (time_elapsed > 15) {
2138
 
                last_monitor_time = ut_time();
 
2023
                last_monitor_time = time(NULL);
2139
2024
 
2140
2025
                if (srv_print_innodb_monitor) {
2141
 
                        /* Reset mutex_skipped counter everytime
2142
 
                        srv_print_innodb_monitor changes. This is to
2143
 
                        ensure we will not be blocked by kernel_mutex
2144
 
                        for short duration information printing,
2145
 
                        such as requested by sync_array_print_long_waits() */
2146
 
                        if (!last_srv_print_monitor) {
2147
 
                                mutex_skipped = 0;
2148
 
                                last_srv_print_monitor = TRUE;
2149
 
                        }
2150
 
 
2151
 
                        if (!srv_printf_innodb_monitor(stderr,
2152
 
                                                MUTEX_NOWAIT(mutex_skipped),
2153
 
                                                NULL, NULL)) {
2154
 
                                mutex_skipped++;
2155
 
                        } else {
2156
 
                                /* Reset the counter */
2157
 
                                mutex_skipped = 0;
2158
 
                        }
2159
 
                } else {
2160
 
                        last_srv_print_monitor = FALSE;
 
2026
                        srv_printf_innodb_monitor(stderr, NULL, NULL);
2161
2027
                }
2162
2028
 
2163
 
 
2164
2029
                if (srv_innodb_status) {
2165
2030
                        mutex_enter(&srv_monitor_file_mutex);
2166
2031
                        rewind(srv_monitor_file);
2167
 
                        if (!srv_printf_innodb_monitor(srv_monitor_file,
2168
 
                                                MUTEX_NOWAIT(mutex_skipped),
2169
 
                                                NULL, NULL)) {
2170
 
                                mutex_skipped++;
2171
 
                        } else {
2172
 
                                mutex_skipped = 0;
2173
 
                        }
2174
 
 
 
2032
                        srv_printf_innodb_monitor(srv_monitor_file, NULL,
 
2033
                                                  NULL);
2175
2034
                        os_file_set_eof(srv_monitor_file);
2176
2035
                        mutex_exit(&srv_monitor_file_mutex);
2177
2036
                }
2179
2038
                if (srv_print_innodb_tablespace_monitor
2180
2039
                    && difftime(current_time,
2181
2040
                                last_tablespace_monitor_time) > 60) {
2182
 
                        last_tablespace_monitor_time = ut_time();
 
2041
                        last_tablespace_monitor_time = time(NULL);
2183
2042
 
2184
2043
                        fputs("========================"
2185
2044
                              "========================\n",
2205
2064
                if (srv_print_innodb_table_monitor
2206
2065
                    && difftime(current_time, last_table_monitor_time) > 60) {
2207
2066
 
2208
 
                        last_table_monitor_time = ut_time();
 
2067
                        last_table_monitor_time = time(NULL);
2209
2068
 
2210
2069
                        fputs("===========================================\n",
2211
2070
                              stderr);
2224
2083
                }
2225
2084
        }
2226
2085
 
2227
 
        if (srv_shutdown_state >= SRV_SHUTDOWN_CLEANUP) {
2228
 
                goto exit_func;
2229
 
        }
2230
 
 
2231
 
        if (srv_print_innodb_monitor
2232
 
            || srv_print_innodb_lock_monitor
2233
 
            || srv_print_innodb_tablespace_monitor
2234
 
            || srv_print_innodb_table_monitor) {
2235
 
                goto loop;
2236
 
        }
2237
 
 
2238
 
        srv_monitor_active = FALSE;
2239
 
 
2240
 
        goto loop;
2241
 
 
2242
 
exit_func:
2243
 
        srv_monitor_active = FALSE;
2244
 
 
2245
 
        /* We count the number of threads in os_thread_exit(). A created
2246
 
        thread should always use that to exit and not use return() to exit. */
2247
 
 
2248
 
        os_thread_exit(NULL);
2249
 
 
2250
 
        OS_THREAD_DUMMY_RETURN;
2251
 
}
2252
 
 
2253
 
/*********************************************************************//**
2254
 
A thread which wakes up threads whose lock wait may have lasted too long.
2255
 
@return a dummy parameter */
2256
 
UNIV_INTERN
2257
 
os_thread_ret_t
2258
 
srv_lock_timeout_thread(
2259
 
/*====================*/
2260
 
        void*   /*arg __attribute__((unused))*/)
2261
 
                        /* in: a dummy parameter required by
2262
 
                        os_thread_create */
2263
 
{
2264
 
        srv_slot_t*     slot;
2265
 
        ibool           some_waits;
2266
 
        double          wait_time;
2267
 
        ulint           i;
2268
 
        ib_int64_t      sig_count;
2269
 
 
2270
 
#ifdef UNIV_PFS_THREAD
2271
 
        pfs_register_thread(srv_lock_timeout_thread_key);
2272
 
#endif
2273
 
 
2274
 
loop:
2275
 
 
2276
 
        /* When someone is waiting for a lock, we wake up every second
2277
 
        and check if a timeout has passed for a lock wait */
2278
 
 
2279
 
        sig_count = os_event_reset(srv_timeout_event);
2280
 
 
2281
 
        os_event_wait_time_low(srv_timeout_event, 1000000, sig_count);
2282
 
 
2283
 
        srv_lock_timeout_active = TRUE;
2284
 
 
2285
2086
        mutex_enter(&kernel_mutex);
2286
2087
 
2287
2088
        some_waits = FALSE;
2305
2106
                        lock_wait_timeout = thd_lock_wait_timeout(
2306
2107
                                trx->mysql_thd);
2307
2108
 
2308
 
                        if (trx_is_interrupted(trx)
2309
 
                            || (lock_wait_timeout < 100000000
2310
 
                                && (wait_time > (double) lock_wait_timeout
2311
 
                                    || wait_time < 0))) {
 
2109
                        if (lock_wait_timeout < 100000000
 
2110
                            && (wait_time > (double) lock_wait_timeout
 
2111
                                || wait_time < 0)) {
2312
2112
 
2313
2113
                                /* Timeout exceeded or a wrap-around in system
2314
2114
                                time counter: cancel the lock request queued
2333
2133
                goto exit_func;
2334
2134
        }
2335
2135
 
2336
 
        if (some_waits) {
 
2136
        if (some_waits || srv_print_innodb_monitor
 
2137
            || srv_print_innodb_lock_monitor
 
2138
            || srv_print_innodb_tablespace_monitor
 
2139
            || srv_print_innodb_table_monitor) {
2337
2140
                goto loop;
2338
2141
        }
2339
2142
 
2340
 
        srv_lock_timeout_active = FALSE;
 
2143
        /* No one was waiting for a lock and no monitor was active:
 
2144
        suspend this thread */
 
2145
 
 
2146
        srv_lock_timeout_and_monitor_active = FALSE;
2341
2147
 
2342
2148
#if 0
2343
2149
        /* The following synchronisation is disabled, since
2347
2153
        goto loop;
2348
2154
 
2349
2155
exit_func:
2350
 
        srv_lock_timeout_active = FALSE;
 
2156
        srv_lock_timeout_and_monitor_active = FALSE;
2351
2157
 
2352
2158
        /* We count the number of threads in os_thread_exit(). A created
2353
2159
        thread should always use that to exit and not use return() to exit. */
2365
2171
os_thread_ret_t
2366
2172
srv_error_monitor_thread(
2367
2173
/*=====================*/
2368
 
        void*   /*arg __attribute__((unused))*/)
 
2174
        void*   arg __attribute__((unused)))
2369
2175
                        /*!< in: a dummy parameter required by
2370
2176
                        os_thread_create */
2371
2177
{
2373
2179
        ulint           fatal_cnt       = 0;
2374
2180
        ib_uint64_t     old_lsn;
2375
2181
        ib_uint64_t     new_lsn;
2376
 
        ib_int64_t      sig_count;
2377
2182
 
2378
2183
        old_lsn = srv_start_lsn;
2379
2184
 
2381
2186
        fprintf(stderr, "Error monitor thread starts, id %lu\n",
2382
2187
                os_thread_pf(os_thread_get_curr_id()));
2383
2188
#endif
2384
 
 
2385
 
#ifdef UNIV_PFS_THREAD
2386
 
        pfs_register_thread(srv_error_monitor_thread_key);
2387
 
#endif
2388
 
 
2389
2189
loop:
2390
2190
        srv_error_monitor_active = TRUE;
2391
2191
 
2449
2249
 
2450
2250
        fflush(stderr);
2451
2251
 
2452
 
        sig_count = os_event_reset(srv_error_event);
2453
 
 
2454
 
        os_event_wait_time_low(srv_error_event, 1000000, sig_count);
 
2252
        os_thread_sleep(1000000);
2455
2253
 
2456
2254
        if (srv_shutdown_state < SRV_SHUTDOWN_CLEANUP) {
2457
2255
 
2468
2266
        OS_THREAD_DUMMY_RETURN;
2469
2267
}
2470
2268
 
2471
 
/**********************************************************************//**
2472
 
Check whether any background thread is active.
2473
 
@return FALSE if all are are suspended or have exited. */
2474
 
UNIV_INTERN
2475
 
ibool
2476
 
srv_is_any_background_thread_active(void)
2477
 
/*=====================================*/
2478
 
{
2479
 
        ulint   i;
2480
 
        ibool   ret = FALSE;
2481
 
 
2482
 
        mutex_enter(&kernel_mutex);
2483
 
 
2484
 
        for (i = SRV_COM; i <= SRV_MASTER; ++i) {
2485
 
                if (srv_n_threads_active[i] != 0) {
2486
 
                        ret = TRUE;
2487
 
                        break;
2488
 
                }
2489
 
        }
2490
 
 
2491
 
        mutex_exit(&kernel_mutex);
2492
 
 
2493
 
        return(ret);
2494
 
}
2495
 
 
2496
2269
/*******************************************************************//**
2497
2270
Tells the InnoDB server that there has been activity in the database
2498
2271
and wakes up the master thread if it is suspended (not sleeping). Used
2499
2272
in the MySQL interface. Note that there is a small chance that the master
2500
 
thread stays suspended (we do not protect our operation with the
2501
 
srv_sys_t->mutex, for performance reasons). */
 
2273
thread stays suspended (we do not protect our operation with the kernel
 
2274
mutex, for performace reasons). */
2502
2275
UNIV_INTERN
2503
2276
void
2504
2277
srv_active_wake_master_thread(void)
2517
2290
}
2518
2291
 
2519
2292
/*******************************************************************//**
2520
 
Tells the purge thread that there has been activity in the database
2521
 
and wakes up the purge thread if it is suspended (not sleeping).  Note
2522
 
that there is a small chance that the purge thread stays suspended
2523
 
(we do not protect our operation with the kernel mutex, for
2524
 
performace reasons). */
2525
 
UNIV_INTERN
2526
 
void
2527
 
srv_wake_purge_thread_if_not_active(void)
2528
 
/*=====================================*/
2529
 
{
2530
 
        ut_ad(!mutex_own(&kernel_mutex));
2531
 
 
2532
 
        if (srv_n_purge_threads > 0
2533
 
            && srv_n_threads_active[SRV_WORKER] == 0) {
2534
 
 
2535
 
                mutex_enter(&kernel_mutex);
2536
 
 
2537
 
                srv_release_threads(SRV_WORKER, 1);
2538
 
 
2539
 
                mutex_exit(&kernel_mutex);
2540
 
        }
2541
 
}
2542
 
 
2543
 
/*******************************************************************//**
2544
2293
Wakes up the master thread if it is suspended or being suspended. */
2545
2294
UNIV_INTERN
2546
2295
void
2556
2305
        mutex_exit(&kernel_mutex);
2557
2306
}
2558
2307
 
2559
 
/*******************************************************************//**
2560
 
Wakes up the purge thread if it's not already awake. */
2561
 
UNIV_INTERN
2562
 
void
2563
 
srv_wake_purge_thread(void)
2564
 
/*=======================*/
2565
 
{
2566
 
        ut_ad(!mutex_own(&kernel_mutex));
2567
 
 
2568
 
        if (srv_n_purge_threads > 0) {
2569
 
 
2570
 
                mutex_enter(&kernel_mutex);
2571
 
 
2572
 
                srv_release_threads(SRV_WORKER, 1);
2573
 
 
2574
 
                mutex_exit(&kernel_mutex);
2575
 
        }
2576
 
}
2577
 
 
2578
2308
/**********************************************************************
2579
2309
The master thread is tasked to ensure that flush of log file happens
2580
2310
once every second in the background. This is to ensure that not more
2592
2322
                log_buffer_sync_in_background(TRUE);
2593
2323
                srv_last_log_flush_time = current_time;
2594
2324
                srv_log_writes_and_flush++;
 
2325
        } else {
 
2326
                /* Actually we don't need to write logs here.
 
2327
                We are just being extra safe here by forcing
 
2328
                the log buffer to log file. */
 
2329
                log_buffer_sync_in_background(FALSE);
 
2330
                srv_log_buffer_writes++;
2595
2331
        }
2596
2332
}
2597
2333
 
2598
 
/********************************************************************//**
2599
 
Do a full purge, reconfigure the purge sub-system if a dynamic
2600
 
change is detected. */
2601
 
static
2602
 
void
2603
 
srv_master_do_purge(void)
2604
 
/*=====================*/
2605
 
{
2606
 
        ulint   n_pages_purged;
2607
 
 
2608
 
        ut_ad(!mutex_own(&kernel_mutex));
2609
 
 
2610
 
        ut_a(srv_n_purge_threads == 0);
2611
 
 
2612
 
        do {
2613
 
                /* Check for shutdown and change in purge config. */
2614
 
                if (srv_fast_shutdown && srv_shutdown_state > 0) {
2615
 
                        /* Nothing to purge. */
2616
 
                        n_pages_purged = 0;
2617
 
                } else {
2618
 
                        n_pages_purged = trx_purge(srv_purge_batch_size);
2619
 
                }
2620
 
 
2621
 
                srv_sync_log_buffer_in_background();
2622
 
 
2623
 
        } while (n_pages_purged > 0);
2624
 
}
2625
 
 
2626
2334
/*********************************************************************//**
2627
2335
The master thread controlling the server.
2628
2336
@return a dummy parameter */
2630
2338
os_thread_ret_t
2631
2339
srv_master_thread(
2632
2340
/*==============*/
2633
 
        void*   /*arg __attribute__((unused))*/)
 
2341
        void*   arg __attribute__((unused)))
2634
2342
                        /*!< in: a dummy parameter required by
2635
2343
                        os_thread_create */
2636
2344
{
2637
 
        buf_pool_stat_t buf_stat;
2638
2345
        os_event_t      event;
2639
2346
        ulint           old_activity_count;
2640
2347
        ulint           n_pages_purged  = 0;
2646
2353
        ulint           n_ios_old;
2647
2354
        ulint           n_ios_very_old;
2648
2355
        ulint           n_pend_ios;
2649
 
        ulint           next_itr_time;
 
2356
        ibool           skip_sleep      = FALSE;
2650
2357
        ulint           i;
2651
2358
 
2652
2359
#ifdef UNIV_DEBUG_THREAD_CREATION
2653
2360
        fprintf(stderr, "Master thread starts, id %lu\n",
2654
2361
                os_thread_pf(os_thread_get_curr_id()));
2655
2362
#endif
2656
 
 
2657
 
#ifdef UNIV_PFS_THREAD
2658
 
        pfs_register_thread(srv_master_thread_key);
2659
 
#endif
2660
 
 
2661
2363
        srv_main_thread_process_no = os_proc_get_number();
2662
2364
        srv_main_thread_id = os_thread_pf(os_thread_get_curr_id());
2663
2365
 
2676
2378
 
2677
2379
        srv_main_thread_op_info = "reserving kernel mutex";
2678
2380
 
2679
 
        buf_get_total_stat(&buf_stat);
2680
 
        n_ios_very_old = log_sys->n_log_ios + buf_stat.n_pages_read
2681
 
                + buf_stat.n_pages_written;
 
2381
        n_ios_very_old = log_sys->n_log_ios + buf_pool->n_pages_read
 
2382
                + buf_pool->n_pages_written;
2682
2383
        mutex_enter(&kernel_mutex);
2683
2384
 
2684
2385
        /* Store the user activity counter at the start of this loop */
2695
2396
        when there is database activity */
2696
2397
 
2697
2398
        srv_last_log_flush_time = time(NULL);
2698
 
 
2699
 
        /* Sleep for 1 second on entrying the for loop below the first time. */
2700
 
        next_itr_time = ut_time_ms() + 1000;
 
2399
        skip_sleep = FALSE;
2701
2400
 
2702
2401
        for (i = 0; i < 10; i++) {
2703
 
                ulint   cur_time = ut_time_ms();
 
2402
                n_ios_old = log_sys->n_log_ios + buf_pool->n_pages_read
 
2403
                        + buf_pool->n_pages_written;
 
2404
                srv_main_thread_op_info = "sleeping";
 
2405
                srv_main_1_second_loops++;
 
2406
 
 
2407
                if (!skip_sleep) {
 
2408
 
 
2409
                        os_thread_sleep(1000000);
 
2410
                        srv_main_sleeps++;
 
2411
                }
 
2412
 
 
2413
                skip_sleep = FALSE;
2704
2414
 
2705
2415
                /* ALTER TABLE in MySQL requires on Unix that the table handler
2706
2416
                can drop tables lazily after there no longer are SELECT
2717
2427
                        goto background_loop;
2718
2428
                }
2719
2429
 
2720
 
                buf_get_total_stat(&buf_stat);
2721
 
 
2722
 
                n_ios_old = log_sys->n_log_ios + buf_stat.n_pages_read
2723
 
                        + buf_stat.n_pages_written;
2724
 
 
2725
 
                srv_main_thread_op_info = "sleeping";
2726
 
                srv_main_1_second_loops++;
2727
 
 
2728
 
                if (next_itr_time > cur_time
2729
 
                    && srv_shutdown_state == SRV_SHUTDOWN_NONE) {
2730
 
 
2731
 
                        /* Get sleep interval in micro seconds. We use
2732
 
                        ut_min() to avoid long sleep in case of
2733
 
                        wrap around. */
2734
 
                        os_thread_sleep(ut_min(1000000,
2735
 
                                        (next_itr_time - cur_time)
2736
 
                                         * 1000));
2737
 
                        srv_main_sleeps++;
2738
 
                }
2739
 
 
2740
 
                /* Each iteration should happen at 1 second interval. */
2741
 
                next_itr_time = ut_time_ms() + 1000;
2742
 
 
2743
2430
                /* Flush logs if needed */
2744
2431
                srv_sync_log_buffer_in_background();
2745
2432
 
2747
2434
                log_free_check();
2748
2435
 
2749
2436
                /* If i/os during one second sleep were less than 5% of
2750
 
                capacity, we assume that there is free disk i/o capacity
2751
 
                available, and it makes sense to do an insert buffer merge. */
 
2437
                capacity, we assume that there is free disk i/o capacity
 
2438
                available, and it makes sense to do an insert buffer merge. */
2752
2439
 
2753
 
                buf_get_total_stat(&buf_stat);
2754
2440
                n_pend_ios = buf_get_n_pending_ios()
2755
2441
                        + log_sys->n_pending_writes;
2756
 
                n_ios = log_sys->n_log_ios + buf_stat.n_pages_read
2757
 
                        + buf_stat.n_pages_written;
 
2442
                n_ios = log_sys->n_log_ios + buf_pool->n_pages_read
 
2443
                        + buf_pool->n_pages_written;
2758
2444
                if (n_pend_ios < SRV_PEND_IO_THRESHOLD
2759
2445
                    && (n_ios - n_ios_old < SRV_RECENT_IO_ACTIVITY)) {
2760
2446
                        srv_main_thread_op_info = "doing insert buffer merge";
2770
2456
                        /* Try to keep the number of modified pages in the
2771
2457
                        buffer pool under the limit wished by the user */
2772
2458
 
2773
 
                        srv_main_thread_op_info =
2774
 
                                "flushing buffer pool pages";
2775
 
                        n_pages_flushed = buf_flush_list(
2776
 
                                PCT_IO(100), IB_ULONGLONG_MAX);
2777
 
 
 
2459
                        n_pages_flushed = buf_flush_batch(BUF_FLUSH_LIST,
 
2460
                                                          PCT_IO(100),
 
2461
                                                          IB_ULONGLONG_MAX);
 
2462
 
 
2463
                        /* If we had to do the flush, it may have taken
 
2464
                        even more than 1 second, and also, there may be more
 
2465
                        to flush. Do not sleep 1 second during the next
 
2466
                        iteration of this loop. */
 
2467
 
 
2468
                        skip_sleep = TRUE;
2778
2469
                } else if (srv_adaptive_flushing) {
2779
2470
 
2780
2471
                        /* Try to keep the rate of flushing of dirty
2783
2474
                        ulint n_flush = buf_flush_get_desired_flush_rate();
2784
2475
 
2785
2476
                        if (n_flush) {
2786
 
                                srv_main_thread_op_info =
2787
 
                                        "flushing buffer pool pages";
2788
2477
                                n_flush = ut_min(PCT_IO(100), n_flush);
2789
2478
                                n_pages_flushed =
2790
 
                                        buf_flush_list(
 
2479
                                        buf_flush_batch(
 
2480
                                                BUF_FLUSH_LIST,
2791
2481
                                                n_flush,
2792
2482
                                                IB_ULONGLONG_MAX);
 
2483
                                skip_sleep = TRUE;
2793
2484
                        }
2794
2485
                }
2795
2486
 
2819
2510
        loop above requests writes for that case. The writes done here
2820
2511
        are not required, and may be disabled. */
2821
2512
 
2822
 
        buf_get_total_stat(&buf_stat);
2823
2513
        n_pend_ios = buf_get_n_pending_ios() + log_sys->n_pending_writes;
2824
 
        n_ios = log_sys->n_log_ios + buf_stat.n_pages_read
2825
 
                + buf_stat.n_pages_written;
 
2514
        n_ios = log_sys->n_log_ios + buf_pool->n_pages_read
 
2515
                + buf_pool->n_pages_written;
2826
2516
 
2827
2517
        srv_main_10_second_loops++;
2828
2518
        if (n_pend_ios < SRV_PEND_IO_THRESHOLD
2829
2519
            && (n_ios - n_ios_very_old < SRV_PAST_IO_ACTIVITY)) {
2830
2520
 
2831
2521
                srv_main_thread_op_info = "flushing buffer pool pages";
2832
 
                buf_flush_list(PCT_IO(100), IB_ULONGLONG_MAX);
 
2522
                buf_flush_batch(BUF_FLUSH_LIST, PCT_IO(100),
 
2523
                                IB_ULONGLONG_MAX);
2833
2524
 
2834
2525
                /* Flush logs if needed */
2835
2526
                srv_sync_log_buffer_in_background();
2844
2535
        /* Flush logs if needed */
2845
2536
        srv_sync_log_buffer_in_background();
2846
2537
 
2847
 
        if (srv_n_purge_threads == 0) {
2848
 
                srv_main_thread_op_info = "master purging";
2849
 
 
2850
 
                srv_master_do_purge();
 
2538
        /* We run a full purge every 10 seconds, even if the server
 
2539
        were active */
 
2540
        do {
2851
2541
 
2852
2542
                if (srv_fast_shutdown && srv_shutdown_state > 0) {
2853
2543
 
2854
2544
                        goto background_loop;
2855
2545
                }
2856
 
        }
 
2546
 
 
2547
                srv_main_thread_op_info = "purging";
 
2548
                n_pages_purged = trx_purge();
 
2549
 
 
2550
                /* Flush logs if needed */
 
2551
                srv_sync_log_buffer_in_background();
 
2552
 
 
2553
        } while (n_pages_purged);
2857
2554
 
2858
2555
        srv_main_thread_op_info = "flushing buffer pool pages";
2859
2556
 
2865
2562
                (> 70 %), we assume we can afford reserving the disk(s) for
2866
2563
                the time it requires to flush 100 pages */
2867
2564
 
2868
 
                n_pages_flushed = buf_flush_list(
2869
 
                        PCT_IO(100), IB_ULONGLONG_MAX);
 
2565
                n_pages_flushed = buf_flush_batch(BUF_FLUSH_LIST,
 
2566
                                                  PCT_IO(100),
 
2567
                                                  IB_ULONGLONG_MAX);
2870
2568
        } else {
2871
2569
                /* Otherwise, we only flush a small number of pages so that
2872
2570
                we do not unnecessarily use much disk i/o capacity from
2873
2571
                other work */
2874
2572
 
2875
 
                n_pages_flushed = buf_flush_list(
2876
 
                          PCT_IO(10), IB_ULONGLONG_MAX);
 
2573
                n_pages_flushed = buf_flush_batch(BUF_FLUSH_LIST,
 
2574
                                                  PCT_IO(10),
 
2575
                                                  IB_ULONGLONG_MAX);
2877
2576
        }
2878
2577
 
2879
2578
        srv_main_thread_op_info = "making checkpoint";
2917
2616
                MySQL tries to drop a table while there are still open handles
2918
2617
                to it and we had to put it to the background drop queue.) */
2919
2618
 
2920
 
                if (srv_shutdown_state == SRV_SHUTDOWN_NONE) {
2921
 
                        os_thread_sleep(100000);
 
2619
                os_thread_sleep(100000);
 
2620
        }
 
2621
 
 
2622
        srv_main_thread_op_info = "purging";
 
2623
 
 
2624
        /* Run a full purge */
 
2625
        do {
 
2626
                if (srv_fast_shutdown && srv_shutdown_state > 0) {
 
2627
 
 
2628
                        break;
2922
2629
                }
2923
 
        }
2924
 
 
2925
 
        if (srv_n_purge_threads == 0) {
2926
 
                srv_main_thread_op_info = "master purging";
2927
 
 
2928
 
                srv_master_do_purge();
2929
 
        }
 
2630
 
 
2631
                srv_main_thread_op_info = "purging";
 
2632
                n_pages_purged = trx_purge();
 
2633
 
 
2634
                /* Flush logs if needed */
 
2635
                srv_sync_log_buffer_in_background();
 
2636
 
 
2637
        } while (n_pages_purged);
2930
2638
 
2931
2639
        srv_main_thread_op_info = "reserving kernel mutex";
2932
2640
 
2944
2652
        } else {
2945
2653
                /* This should do an amount of IO similar to the number of
2946
2654
                dirty pages that will be flushed in the call to
2947
 
                buf_flush_list below. Otherwise, the system favors
 
2655
                buf_flush_batch below. Otherwise, the system favors
2948
2656
                clean pages over cleanup throughput. */
2949
2657
                n_bytes_merged = ibuf_contract_for_n_pages(FALSE,
2950
2658
                                                           PCT_IO(100));
2963
2671
        srv_main_thread_op_info = "flushing buffer pool pages";
2964
2672
        srv_main_flush_loops++;
2965
2673
        if (srv_fast_shutdown < 2) {
2966
 
                n_pages_flushed = buf_flush_list(
2967
 
                          PCT_IO(100), IB_ULONGLONG_MAX);
 
2674
                n_pages_flushed = buf_flush_batch(BUF_FLUSH_LIST,
 
2675
                                                  PCT_IO(100),
 
2676
                                                  IB_ULONGLONG_MAX);
2968
2677
        } else {
2969
2678
                /* In the fastest shutdown we do not flush the buffer pool
2970
2679
                to data files: we set n_pages_flushed to 0 artificially. */
2982
2691
        mutex_exit(&kernel_mutex);
2983
2692
 
2984
2693
        srv_main_thread_op_info = "waiting for buffer pool flush to end";
2985
 
        buf_flush_wait_batch_end(NULL, BUF_FLUSH_LIST);
 
2694
        buf_flush_wait_batch_end(BUF_FLUSH_LIST);
2986
2695
 
2987
2696
        /* Flush logs if needed */
2988
2697
        srv_sync_log_buffer_in_background();
3069
2778
                already when the event wait ends */
3070
2779
 
3071
2780
                os_thread_exit(NULL);
3072
 
 
3073
2781
        }
3074
2782
 
3075
2783
        /* When there is user activity, InnoDB will set the event and the
3078
2786
        goto loop;
3079
2787
 
3080
2788
 
3081
 
#if !defined(__SUNPRO_C)
 
2789
#if (!defined(__SUNPRO_C) && !defined(__SUNPRO_CC))
3082
2790
        OS_THREAD_DUMMY_RETURN; /* Not reached, avoid compiler warning */
3083
2791
#endif
3084
2792
}
3085
 
 
3086
 
/*********************************************************************//**
3087
 
Asynchronous purge thread.
3088
 
@return a dummy parameter */
3089
 
UNIV_INTERN
3090
 
os_thread_ret_t
3091
 
srv_purge_thread(
3092
 
/*=============*/
3093
 
        void*   /*arg __attribute__((unused))*/)        /*!< in: a dummy parameter
3094
 
                                                required by os_thread_create */
3095
 
{
3096
 
        srv_slot_t*     slot;
3097
 
        ulint           slot_no = ULINT_UNDEFINED;
3098
 
        ulint           n_total_purged = ULINT_UNDEFINED;
3099
 
 
3100
 
        ut_a(srv_n_purge_threads == 1);
3101
 
 
3102
 
#ifdef UNIV_DEBUG_THREAD_CREATION
3103
 
        fprintf(stderr, "InnoDB: Purge thread running, id %lu\n",
3104
 
                os_thread_pf(os_thread_get_curr_id()));
3105
 
#endif /* UNIV_DEBUG_THREAD_CREATION */
3106
 
 
3107
 
        mutex_enter(&kernel_mutex);
3108
 
 
3109
 
        slot_no = srv_table_reserve_slot(SRV_WORKER);
3110
 
 
3111
 
        slot = srv_table_get_nth_slot(slot_no);
3112
 
 
3113
 
        ++srv_n_threads_active[SRV_WORKER];
3114
 
 
3115
 
        mutex_exit(&kernel_mutex);
3116
 
 
3117
 
        while (srv_shutdown_state != SRV_SHUTDOWN_EXIT_THREADS) {
3118
 
 
3119
 
                ulint   n_pages_purged;
3120
 
 
3121
 
                /* If there are very few records to purge or the last
3122
 
                purge didn't purge any records then wait for activity.
3123
 
                We peek at the history len without holding any mutex
3124
 
                because in the worst case we will end up waiting for
3125
 
                the next purge event. */
3126
 
                if (trx_sys->rseg_history_len < srv_purge_batch_size
3127
 
                    || n_total_purged == 0) {
3128
 
 
3129
 
                        os_event_t      event;
3130
 
 
3131
 
                        mutex_enter(&kernel_mutex);
3132
 
 
3133
 
                        event = srv_suspend_thread();
3134
 
 
3135
 
                        mutex_exit(&kernel_mutex);
3136
 
 
3137
 
                        os_event_wait(event);
3138
 
                }
3139
 
 
3140
 
                /* Check for shutdown and whether we should do purge at all. */
3141
 
                if (srv_force_recovery >= SRV_FORCE_NO_BACKGROUND
3142
 
                    || srv_shutdown_state != 0
3143
 
                    || srv_fast_shutdown) {
3144
 
 
3145
 
                        break;
3146
 
                }
3147
 
 
3148
 
                n_total_purged = 0;
3149
 
 
3150
 
                /* Purge until there are no more records to purge and there is
3151
 
                no change in configuration or server state. */
3152
 
                do {
3153
 
                        n_pages_purged = trx_purge(srv_purge_batch_size);
3154
 
 
3155
 
                        n_total_purged += n_pages_purged;
3156
 
 
3157
 
                } while (n_pages_purged > 0 && !srv_fast_shutdown);
3158
 
 
3159
 
                srv_sync_log_buffer_in_background();
3160
 
        }
3161
 
 
3162
 
        mutex_enter(&kernel_mutex);
3163
 
 
3164
 
        ut_ad(srv_table_get_nth_slot(slot_no) == slot);
3165
 
 
3166
 
        /* Decrement the active count. */
3167
 
        srv_suspend_thread();
3168
 
 
3169
 
        slot->in_use = FALSE;
3170
 
 
3171
 
        /* Free the thread local memory. */
3172
 
        thr_local_free(os_thread_get_curr_id());
3173
 
 
3174
 
        mutex_exit(&kernel_mutex);
3175
 
 
3176
 
#ifdef UNIV_DEBUG_THREAD_CREATION
3177
 
        fprintf(stderr, "InnoDB: Purge thread exiting, id %lu\n",
3178
 
                os_thread_pf(os_thread_get_curr_id()));
3179
 
#endif /* UNIV_DEBUG_THREAD_CREATION */
3180
 
 
3181
 
        /* We count the number of threads in os_thread_exit(). A created
3182
 
        thread should always use that to exit and not use return() to exit. */
3183
 
        os_thread_exit(NULL);
3184
 
 
3185
 
        OS_THREAD_DUMMY_RETURN; /* Not reached, avoid compiler warning */
3186
 
}
3187
 
 
3188
 
/**********************************************************************//**
3189
 
Enqueues a task to server task queue and releases a worker thread, if there
3190
 
is a suspended one. */
3191
 
UNIV_INTERN
3192
 
void
3193
 
srv_que_task_enqueue_low(
3194
 
/*=====================*/
3195
 
        que_thr_t*      thr)    /*!< in: query thread */
3196
 
{
3197
 
        ut_ad(thr);
3198
 
 
3199
 
        mutex_enter(&kernel_mutex);
3200
 
 
3201
 
        UT_LIST_ADD_LAST(queue, srv_sys->tasks, thr);
3202
 
 
3203
 
        srv_release_threads(SRV_WORKER, 1);
3204
 
 
3205
 
        mutex_exit(&kernel_mutex);
3206
 
}