~unity-2d-team/unity-2d/Shell-MultiMonitor

« back to all changes in this revision

Viewing changes to grackle/model.py

  • Committer: William Grant
  • Date: 2012-01-22 12:35:09 UTC
  • Revision ID: william.grant@canonical.com-20120122123509-hh1m5nc5sv718t2o
Fix batching to almost work backwards too.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (c) 2012 Canonical Ltd
 
2
#
 
3
# This program is free software: you can redistribute it and/or modify
 
4
# it under the terms of the GNU Affero General Public License as published by
 
5
# the Free Software Foundation, either version 3 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU Affero General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU Affero General Public
 
14
# License along with this program. If not, see
 
15
# <http://www.gnu.org/licenses/>.
 
16
 
 
17
import datetime
 
18
import dateutil.tz
 
19
import email.parser
 
20
from email.utils import parsedate_tz
 
21
import logging
 
22
import uuid
 
23
 
 
24
import pycassa
 
25
from pycassa.system_manager import (
 
26
    LEXICAL_UUID_TYPE,
 
27
    SystemManager,
 
28
    TIME_UUID_TYPE,
 
29
    )
 
30
 
 
31
from grackle.cassandra import workaround_1779
 
32
 
 
33
 
 
34
def create_schema(host, keyspace, clobber=False, create_keyspace=False):
 
35
    mgr = SystemManager(host)
 
36
 
 
37
    if create_keyspace:
 
38
        mgr.create_keyspace(keyspace, replication_factor=1)
 
39
 
 
40
    if clobber:
 
41
        for cf in mgr.get_keyspace_column_families(keyspace):
 
42
            mgr.drop_column_family(keyspace, cf)
 
43
 
 
44
    try:
 
45
        workaround_1779(
 
46
            mgr.create_column_family, keyspace, 'message',
 
47
            key_validation_class=LEXICAL_UUID_TYPE)
 
48
        workaround_1779(
 
49
            mgr.create_column_family, keyspace, 'archive_message',
 
50
            comparator_type=TIME_UUID_TYPE,
 
51
            default_validation_class=LEXICAL_UUID_TYPE)
 
52
        pass
 
53
    finally:
 
54
        mgr.close()
 
55
 
 
56
 
 
57
def _parse_message(message):
 
58
    """Get a date and dict of an RFC822 message."""
 
59
    parsed = email.parser.Parser().parsestr(message)
 
60
    message_dict = {}
 
61
 
 
62
    for key in ('from', 'to', 'subject', 'message-id'):
 
63
        value = parsed.get(key, None)
 
64
        if value is not None:
 
65
            message_dict[key] = value
 
66
 
 
67
    date = parsed.get('date')
 
68
    if date is not None:
 
69
        try:
 
70
            pdate = parsedate_tz(date)
 
71
            date = datetime.datetime(
 
72
                *pdate[:6],
 
73
                tzinfo=dateutil.tz.tzoffset('', pdate[9]))
 
74
        except ValueError:
 
75
            pass
 
76
    message_dict['date'] = date.isoformat() if date is not None else None
 
77
 
 
78
    return date, message_dict
 
79
 
 
80
 
 
81
class CassandraConnection(object):
 
82
 
 
83
    def __init__(self, keyspace, host):
 
84
        self._keyspace = keyspace
 
85
        self._host = host
 
86
        self._connection = self._connect()
 
87
        self.messages = self._column_family('message')
 
88
        self.archive_messages = self._column_family('archive_message')
 
89
 
 
90
    def _connect(self):
 
91
        return pycassa.connect(self._keyspace, self._host)
 
92
 
 
93
    def _column_family(self, name):
 
94
        return pycassa.ColumnFamily(self._connection, name)
 
95
 
 
96
    def add_message(self, archive_uuid, message):
 
97
        message_uuid = uuid.uuid4()
 
98
        message_date, message_dict = _parse_message(message)
 
99
        message_dict['content'] = message
 
100
        message_dict['date_created'] = (
 
101
            datetime.datetime.utcnow().isoformat() + 'Z')
 
102
        self.messages.insert(message_uuid, message_dict)
 
103
        self.archive_messages.insert(
 
104
            archive_uuid,
 
105
            {message_date.astimezone(dateutil.tz.tzutc()): message_uuid})
 
106
        logging.debug(
 
107
            'Imported %s into %s'
 
108
            % (message_dict.get('message-id', None), archive_uuid))
 
109
        return message_uuid
 
110
 
 
111
    def _format_message(self, message):
 
112
        return {
 
113
            'date': message.get('date'),
 
114
            'from': message.get('from'),
 
115
            'subject': message.get('subject'),
 
116
            'message-id': message.get('message-id'),
 
117
            }
 
118
 
 
119
    def get_messages(self, archive_uuid, order, count, memo):
 
120
        if order in ("date", "-date"):
 
121
            reversed = order[0] == '-'
 
122
        else:
 
123
            raise AssertionError("Unsupported order.")
 
124
        if memo != '':
 
125
            memo = uuid.UUID(memo)
 
126
        # Get up to n+1 messages from the memo: the last item of the
 
127
        # previous batch (because that's where the memo starts) + this
 
128
        # batch.
 
129
        pairs = self.archive_messages.get(
 
130
            archive_uuid, column_count=count + 1,
 
131
            column_start=memo, column_reversed=reversed).items()
 
132
 
 
133
        if memo and len(pairs) and pairs[0][0] <= memo:
 
134
            pairs = pairs[1:]
 
135
        elif len(pairs) > count:
 
136
            pairs = pairs[:-1]
 
137
 
 
138
        if len(pairs) == 0:
 
139
            return (None, [], None)
 
140
 
 
141
        assert 0 < len(pairs) <= count
 
142
 
 
143
        ids = [v for k, v in pairs]
 
144
        messages = self.messages.multiget(
 
145
            ids, columns=['date', 'from', 'subject', 'message-id'])
 
146
 
 
147
        return (
 
148
            str(pairs[0][0]),
 
149
            [self._format_message(messages[id]) for id in ids],
 
150
            str(pairs[-1][0]),
 
151
            )