~launchpad-pqm/launchpad/devel

« back to all changes in this revision

Viewing changes to lib/lp/bugs/scripts/bugzilla.py

  • Committer: Launchpad Patch Queue Manager
  • Date: 2011-08-02 23:44:26 UTC
  • mfrom: (13589.1.1 revert-r13574)
  • Revision ID: launchpad@pqm.canonical.com-20110802234426-z03j07sj334l9ay0
[r=wgrant][rollback=13574] Revert r13574. It crashes when the flag is
 enabled, see bug #810290.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright 2009 Canonical Ltd.  This software is licensed under the
 
2
# GNU Affero General Public License version 3 (see the file LICENSE).
 
3
 
 
4
"""Bugzilla to Launchpad import logic"""
 
5
 
 
6
 
 
7
# Bugzilla schema:
 
8
# http://lxr.mozilla.org/mozilla/source/webtools/bugzilla/Bugzilla/DB/Schema.pm
 
9
 
 
10
# XXX: jamesh 2005-10-18
 
11
# Currently unhandled bug info:
 
12
#  * Operating system and platform
 
13
#  * version (not really used in Ubuntu bugzilla though)
 
14
#  * keywords
 
15
#  * private bugs (none of the canonical-only bugs seem sensitive though)
 
16
#  * bug dependencies
 
17
#  * "bug XYZ" references inside comment text (at the moment we just
 
18
#    insert the full URL to the bug afterwards).
 
19
#
 
20
# Not all of these are necessary though
 
21
 
 
22
__metaclass__ = type
 
23
 
 
24
from cStringIO import StringIO
 
25
import datetime
 
26
import logging
 
27
import re
 
28
 
 
29
import pytz
 
30
from storm.store import Store
 
31
from zope.component import getUtility
 
32
 
 
33
from canonical.launchpad.interfaces.emailaddress import IEmailAddressSet
 
34
from canonical.launchpad.interfaces.librarian import ILibraryFileAliasSet
 
35
from canonical.launchpad.webapp import canonical_url
 
36
from lp.app.errors import NotFoundError
 
37
from lp.app.interfaces.launchpad import ILaunchpadCelebrities
 
38
from lp.bugs.interfaces.bug import (
 
39
    CreateBugParams,
 
40
    IBugSet,
 
41
    )
 
42
from lp.bugs.interfaces.bugattachment import (
 
43
    BugAttachmentType,
 
44
    IBugAttachmentSet,
 
45
    )
 
46
from lp.bugs.interfaces.bugtask import (
 
47
    BugTaskImportance,
 
48
    BugTaskStatus,
 
49
    IBugTaskSet,
 
50
    )
 
51
from lp.bugs.interfaces.bugwatch import IBugWatchSet
 
52
from lp.bugs.interfaces.cve import ICveSet
 
53
from lp.registry.interfaces.person import (
 
54
    IPersonSet,
 
55
    PersonCreationRationale,
 
56
    )
 
57
from lp.services.messages.interfaces.message import IMessageSet
 
58
 
 
59
 
 
60
logger = logging.getLogger('lp.bugs.scripts.bugzilla')
 
61
 
 
62
 
 
63
def _add_tz(dt):
 
64
    """Convert a naiive datetime value to a UTC datetime value."""
 
65
    assert dt.tzinfo is None, 'add_tz() only accepts naiive datetime values'
 
66
    return datetime.datetime(dt.year, dt.month, dt.day,
 
67
                             dt.hour, dt.minute, dt.second,
 
68
                             dt.microsecond, tzinfo=pytz.timezone('UTC'))
 
69
 
 
70
 
 
71
class BugzillaBackend:
 
72
    """A wrapper for all the MySQL database access.
 
73
 
 
74
    The main purpose of this is to make it possible to test the rest
 
75
    of the import code without access to a MySQL database.
 
76
    """
 
77
    def __init__(self, conn, charset='UTF-8'):
 
78
        self.conn = conn
 
79
        self.cursor = conn.cursor()
 
80
        self.charset = charset
 
81
 
 
82
    def _decode(self, s):
 
83
        if s is not None:
 
84
            value = s.decode(self.charset, 'replace')
 
85
            # Postgres doesn't like values outside of the basic multilingual
 
86
            # plane (U+0000 - U+FFFF), so replace them (and surrogates) with
 
87
            # U+FFFD (replacement character).
 
88
            # Existance of these characters generally indicate an encoding
 
89
            # problem in the existing Bugzilla data.
 
90
            return re.sub(u'[^\u0000-\ud7ff\ue000-\uffff]', u'\ufffd', value)
 
91
        else:
 
92
            return None
 
93
 
 
94
    def lookupUser(self, user_id):
 
95
        """Look up information about a particular Bugzilla user ID"""
 
96
        self.cursor.execute('SELECT login_name, realname '
 
97
                            '  FROM profiles '
 
98
                            '  WHERE userid = %d' % user_id)
 
99
        if self.cursor.rowcount != 1:
 
100
            raise NotFoundError('could not look up user %d' % user_id)
 
101
        (login_name, realname) = self.cursor.fetchone()
 
102
        realname = self._decode(realname)
 
103
        return (login_name, realname)
 
104
 
 
105
    def getBugInfo(self, bug_id):
 
106
        """Retrieve information about a bug."""
 
107
        self.cursor.execute(
 
108
            'SELECT bug_id, assigned_to, bug_file_loc, bug_severity, '
 
109
            '    bug_status, creation_ts, short_desc, op_sys, priority, '
 
110
            '    products.name, rep_platform, reporter, version, '
 
111
            '    components.name, resolution, target_milestone, qa_contact, '
 
112
            '    status_whiteboard, keywords, alias '
 
113
            '  FROM bugs '
 
114
            '    INNER JOIN products ON bugs.product_id = products.id '
 
115
            '    INNER JOIN components ON bugs.component_id = components.id '
 
116
            '  WHERE bug_id = %d' % bug_id)
 
117
        if self.cursor.rowcount != 1:
 
118
            raise NotFoundError('could not look up bug %d' % bug_id)
 
119
        (bug_id, assigned_to, bug_file_loc, bug_severity, bug_status,
 
120
         creation_ts, short_desc, op_sys, priority, product,
 
121
         rep_platform, reporter, version, component, resolution,
 
122
         target_milestone, qa_contact, status_whiteboard, keywords,
 
123
         alias) = self.cursor.fetchone()
 
124
 
 
125
        bug_file_loc = self._decode(bug_file_loc)
 
126
        creation_ts = _add_tz(creation_ts)
 
127
        product = self._decode(product)
 
128
        version = self._decode(version)
 
129
        component = self._decode(component)
 
130
        status_whiteboard = self._decode(status_whiteboard)
 
131
        keywords = self._decode(keywords)
 
132
        alias = self._decode(alias)
 
133
 
 
134
        return (bug_id, assigned_to, bug_file_loc, bug_severity,
 
135
                bug_status, creation_ts, short_desc, op_sys, priority,
 
136
                product, rep_platform, reporter, version, component,
 
137
                resolution, target_milestone, qa_contact,
 
138
                status_whiteboard, keywords, alias)
 
139
 
 
140
    def getBugCcs(self, bug_id):
 
141
        """Get the IDs of the people CC'd to the bug."""
 
142
        self.cursor.execute('SELECT who FROM cc WHERE bug_id = %d'
 
143
                            % bug_id)
 
144
        return [row[0] for row in self.cursor.fetchall()]
 
145
 
 
146
    def getBugComments(self, bug_id):
 
147
        """Get the comments for the bug."""
 
148
        self.cursor.execute('SELECT who, bug_when, thetext '
 
149
                            '  FROM longdescs '
 
150
                            '  WHERE bug_id = %d '
 
151
                            '  ORDER BY bug_when' % bug_id)
 
152
        # XXX: jamesh 2005-12-07:
 
153
        # Due to a bug in Debzilla, Ubuntu bugzilla bug 248 has > 7800
 
154
        # duplicate comments,consisting of someone's signature.
 
155
        # For the import, just ignore those comments.
 
156
        return [(who, _add_tz(when), self._decode(thetext))
 
157
                 for (who, when, thetext) in self.cursor.fetchall()
 
158
                 if thetext != '\n--=20\n   Jacobo Tarr=EDo     |     '
 
159
                               'http://jacobo.tarrio.org/\n\n\n']
 
160
 
 
161
    def getBugAttachments(self, bug_id):
 
162
        """Get the attachments for the bug."""
 
163
        self.cursor.execute('SELECT attach_id, creation_ts, description, '
 
164
                            '    mimetype, ispatch, filename, thedata, '
 
165
                            '    submitter_id '
 
166
                            '  FROM attachments '
 
167
                            '  WHERE bug_id = %d '
 
168
                            '  ORDER BY attach_id' % bug_id)
 
169
        return [(attach_id, _add_tz(creation_ts),
 
170
                 self._decode(description), mimetype,
 
171
                 ispatch, self._decode(filename), thedata, submitter_id)
 
172
                for (attach_id, creation_ts, description,
 
173
                     mimetype, ispatch, filename, thedata,
 
174
                     submitter_id) in self.cursor.fetchall()]
 
175
 
 
176
    def findBugs(self, product=None, component=None, status=None):
 
177
        """Returns the requested bug IDs as a list"""
 
178
        if product is None:
 
179
            product = []
 
180
        if component is None:
 
181
            component = []
 
182
        if status is None:
 
183
            status = []
 
184
        joins = []
 
185
        conditions = []
 
186
        if product:
 
187
            joins.append(
 
188
                'INNER JOIN products ON bugs.product_id = products.id')
 
189
            conditions.append('products.name IN (%s)' %
 
190
                ', '.join([self.conn.escape(p) for p in product]))
 
191
        if component:
 
192
            joins.append(
 
193
                'INNER JOIN components ON bugs.component_id = components.id')
 
194
            conditions.append('components.name IN (%s)' %
 
195
                ', '.join([self.conn.escape(c) for c in component]))
 
196
        if status:
 
197
            conditions.append('bugs.bug_status IN (%s)' %
 
198
                ', '.join([self.conn.escape(s) for s in status]))
 
199
        if conditions:
 
200
            conditions = 'WHERE %s' % ' AND '.join(conditions)
 
201
        else:
 
202
            conditions = ''
 
203
        self.cursor.execute('SELECT bug_id FROM bugs %s %s ORDER BY bug_id' %
 
204
                            (' '.join(joins), conditions))
 
205
        return [bug_id for (bug_id,) in self.cursor.fetchall()]
 
206
 
 
207
    def getDuplicates(self):
 
208
        """Returns a list of (dupe_of, dupe) relations."""
 
209
        self.cursor.execute('SELECT dupe_of, dupe FROM duplicates '
 
210
                            'ORDER BY dupe, dupe_of')
 
211
        return [(dupe_of, dupe) for (dupe_of, dupe) in self.cursor.fetchall()]
 
212
 
 
213
 
 
214
class Bug:
 
215
    """Representation of a Bugzilla Bug"""
 
216
    def __init__(self, backend, bug_id):
 
217
        self.backend = backend
 
218
        (self.bug_id, self.assigned_to, self.bug_file_loc, self.bug_severity,
 
219
         self.bug_status, self.creation_ts, self.short_desc, self.op_sys,
 
220
         self.priority, self.product, self.rep_platform, self.reporter,
 
221
         self.version, self.component, self.resolution,
 
222
         self.target_milestone, self.qa_contact, self.status_whiteboard,
 
223
         self.keywords, self.alias) = backend.getBugInfo(bug_id)
 
224
 
 
225
        self._ccs = None
 
226
        self._comments = None
 
227
        self._attachments = None
 
228
 
 
229
    @property
 
230
    def ccs(self):
 
231
        """Return the IDs of people CC'd to this bug"""
 
232
        if self._ccs is not None:
 
233
            return self._ccs
 
234
        self._ccs = self.backend.getBugCcs(self.bug_id)
 
235
        return self._ccs
 
236
 
 
237
    @property
 
238
    def comments(self):
 
239
        """Return the comments attached to this bug"""
 
240
        if self._comments is not None:
 
241
            return self._comments
 
242
        self._comments = self.backend.getBugComments(self.bug_id)
 
243
        return self._comments
 
244
 
 
245
    @property
 
246
    def attachments(self):
 
247
        """Return the attachments for this bug"""
 
248
        if self._attachments is not None:
 
249
            return self._attachments
 
250
        self._attachments = self.backend.getBugAttachments(self.bug_id)
 
251
        return self._attachments
 
252
 
 
253
    def mapSeverity(self, bugtask):
 
254
        """Set a Launchpad bug task's importance based on this bug's severity.
 
255
        """
 
256
        bug_importer = getUtility(ILaunchpadCelebrities).bug_importer
 
257
        importance_map = {
 
258
            'blocker': BugTaskImportance.CRITICAL,
 
259
            'critical': BugTaskImportance.CRITICAL,
 
260
            'major': BugTaskImportance.HIGH,
 
261
            'normal': BugTaskImportance.MEDIUM,
 
262
            'minor': BugTaskImportance.LOW,
 
263
            'trivial': BugTaskImportance.LOW,
 
264
            'enhancement': BugTaskImportance.WISHLIST
 
265
            }
 
266
        importance = importance_map.get(
 
267
            self.bug_severity, BugTaskImportance.UNKNOWN)
 
268
        bugtask.transitionToImportance(importance, bug_importer)
 
269
 
 
270
    def mapStatus(self, bugtask):
 
271
        """Set a Launchpad bug task's status based on this bug's status.
 
272
 
 
273
        If the bug is in the RESOLVED, VERIFIED or CLOSED states, the
 
274
        bug resolution is also taken into account when mapping the
 
275
        status.
 
276
 
 
277
        Additional information about the bugzilla status is appended
 
278
        to the bug task's status explanation.
 
279
        """
 
280
        bug_importer = getUtility(ILaunchpadCelebrities).bug_importer
 
281
 
 
282
        if self.bug_status == 'ASSIGNED':
 
283
            bugtask.transitionToStatus(
 
284
                BugTaskStatus.CONFIRMED, bug_importer)
 
285
        elif self.bug_status == 'NEEDINFO':
 
286
            bugtask.transitionToStatus(
 
287
                BugTaskStatus.INCOMPLETE, bug_importer)
 
288
        elif self.bug_status == 'PENDINGUPLOAD':
 
289
            bugtask.transitionToStatus(
 
290
                BugTaskStatus.FIXCOMMITTED, bug_importer)
 
291
        elif self.bug_status in ['RESOLVED', 'VERIFIED', 'CLOSED']:
 
292
            # depends on the resolution:
 
293
            if self.resolution == 'FIXED':
 
294
                bugtask.transitionToStatus(
 
295
                    BugTaskStatus.FIXRELEASED, bug_importer)
 
296
            else:
 
297
                bugtask.transitionToStatus(
 
298
                    BugTaskStatus.INVALID, bug_importer)
 
299
        else:
 
300
            bugtask.transitionToStatus(
 
301
                BugTaskStatus.NEW, bug_importer)
 
302
 
 
303
        # add the status to the notes section, to account for any lost
 
304
        # information
 
305
        bugzilla_status = 'Bugzilla status=%s' % self.bug_status
 
306
        if self.resolution:
 
307
            bugzilla_status += ' %s' % self.resolution
 
308
        bugzilla_status += ', product=%s' % self.product
 
309
        bugzilla_status += ', component=%s' % self.component
 
310
 
 
311
        if bugtask.statusexplanation:
 
312
            bugtask.statusexplanation = '%s (%s)' % (
 
313
                bugtask.statusexplanation, bugzilla_status)
 
314
        else:
 
315
            bugtask.statusexplanation = bugzilla_status
 
316
 
 
317
 
 
318
class Bugzilla:
 
319
    """Representation of a bugzilla instance"""
 
320
 
 
321
    def __init__(self, conn):
 
322
        if conn is not None:
 
323
            self.backend = BugzillaBackend(conn)
 
324
        else:
 
325
            self.backend = None
 
326
        self.ubuntu = getUtility(ILaunchpadCelebrities).ubuntu
 
327
        self.debian = getUtility(ILaunchpadCelebrities).debian
 
328
        self.bugtracker = getUtility(ILaunchpadCelebrities).ubuntu_bugzilla
 
329
        self.debbugs = getUtility(ILaunchpadCelebrities).debbugs
 
330
        self.bugset = getUtility(IBugSet)
 
331
        self.bugtaskset = getUtility(IBugTaskSet)
 
332
        self.bugwatchset = getUtility(IBugWatchSet)
 
333
        self.cveset = getUtility(ICveSet)
 
334
        self.personset = getUtility(IPersonSet)
 
335
        self.emailset = getUtility(IEmailAddressSet)
 
336
        self.person_mapping = {}
 
337
 
 
338
    def person(self, bugzilla_id):
 
339
        """Get the Launchpad person corresponding to the given Bugzilla ID"""
 
340
        # Bugzilla treats a user ID of 0 as a NULL
 
341
        if bugzilla_id == 0:
 
342
            return None
 
343
 
 
344
        # Try and get the person using a cache of the mapping.  We
 
345
        # check to make sure the person still exists and has not been
 
346
        # merged.
 
347
        person = None
 
348
        launchpad_id = self.person_mapping.get(bugzilla_id)
 
349
        if launchpad_id is not None:
 
350
            person = self.personset.get(launchpad_id)
 
351
            if person is not None and person.merged is not None:
 
352
                person = None
 
353
 
 
354
        # look up the person
 
355
        if person is None:
 
356
            email, displayname = self.backend.lookupUser(bugzilla_id)
 
357
 
 
358
            person = self.personset.ensurePerson(
 
359
                email, displayname, PersonCreationRationale.BUGIMPORT,
 
360
                comment=('when importing bugs from %s'
 
361
                         % self.bugtracker.baseurl))
 
362
 
 
363
            # Bugzilla performs similar address checks to Launchpad, so
 
364
            # if the Launchpad account has no preferred email, use the
 
365
            # Bugzilla one.
 
366
            emailaddr = self.emailset.getByEmail(email)
 
367
            assert emailaddr is not None
 
368
            if person.preferredemail != emailaddr:
 
369
                person.validateAndEnsurePreferredEmail(emailaddr)
 
370
 
 
371
            self.person_mapping[bugzilla_id] = person.id
 
372
 
 
373
        return person
 
374
 
 
375
    def _getPackageName(self, bug):
 
376
        """Returns the source package name for the given bug."""
 
377
        # we currently only support mapping Ubuntu bugs ...
 
378
        if bug.product != 'Ubuntu':
 
379
            raise AssertionError('product must be Ubuntu')
 
380
 
 
381
        # kernel bugs are currently filed against the "linux"
 
382
        # component, which is not a source or binary package.  The
 
383
        # following mapping was provided by BenC:
 
384
        if bug.component == 'linux':
 
385
            cutoffdate = datetime.datetime(2004, 12, 1,
 
386
                                           tzinfo=pytz.timezone('UTC'))
 
387
            if bug.bug_status == 'NEEDINFO' and bug.creation_ts < cutoffdate:
 
388
                pkgname = 'linux-source-2.6.12'
 
389
            else:
 
390
                pkgname = 'linux-source-2.6.15'
 
391
        else:
 
392
            pkgname = bug.component.encode('ASCII')
 
393
 
 
394
        try:
 
395
            return self.ubuntu.guessPublishedSourcePackageName(pkgname)
 
396
        except NotFoundError, e:
 
397
            logger.warning('could not find package name for "%s": %s',
 
398
                           pkgname, str(e))
 
399
            return None
 
400
 
 
401
    def getLaunchpadBugTarget(self, bug):
 
402
        """Returns a dictionary of arguments to createBug() that correspond
 
403
        to the given bugzilla bug.
 
404
        """
 
405
        srcpkg = self._getPackageName(bug)
 
406
        return {
 
407
            'distribution': self.ubuntu,
 
408
            'sourcepackagename': srcpkg,
 
409
            }
 
410
 
 
411
    def getLaunchpadMilestone(self, bug):
 
412
        """Return the Launchpad milestone for a Bugzilla bug.
 
413
 
 
414
        If the milestone does not exist, then it is created.
 
415
        """
 
416
        if bug.product != 'Ubuntu':
 
417
            raise AssertionError('product must be Ubuntu')
 
418
 
 
419
        # Bugzilla uses a value of "---" to represent "no selected Milestone"
 
420
        # Launchpad represents this by setting the milestone column to NULL.
 
421
        if bug.target_milestone is None or bug.target_milestone == '---':
 
422
            return None
 
423
 
 
424
        # generate a Launchpad name from the Milestone name:
 
425
        name = re.sub(r'[^a-z0-9\+\.\-]', '-', bug.target_milestone.lower())
 
426
 
 
427
        milestone = self.ubuntu.getMilestone(name)
 
428
        if milestone is None:
 
429
            milestone = self.ubuntu.currentseries.newMilestone(name)
 
430
            Store.of(milestone).flush()
 
431
        return milestone
 
432
 
 
433
    def getLaunchpadUpstreamProduct(self, bug):
 
434
        """Find the upstream product for the given Bugzilla bug.
 
435
 
 
436
        This function relies on the package -> product linkage having been
 
437
        entered in advance.
 
438
        """
 
439
        srcpkgname = self._getPackageName(bug)
 
440
        # find a product series
 
441
        series = None
 
442
        for series in self.ubuntu.series:
 
443
            srcpkg = series.getSourcePackage(srcpkgname)
 
444
            if srcpkg:
 
445
                series = srcpkg.productseries
 
446
                if series:
 
447
                    return series.product
 
448
        else:
 
449
            logger.warning('could not find upstream product for '
 
450
                           'source package "%s"', srcpkgname.name)
 
451
            return None
 
452
 
 
453
    _bug_re = re.compile('bug\s*#?\s*(?P<id>\d+)', re.IGNORECASE)
 
454
 
 
455
    def replaceBugRef(self, match):
 
456
        # XXX: jamesh 2005-10-24:
 
457
        # this is where bug number rewriting would be plugged in
 
458
        bug_id = int(match.group('id'))
 
459
        url = '%s/%d' % (canonical_url(self.bugtracker), bug_id)
 
460
        return '%s [%s]' % (match.group(0), url)
 
461
 
 
462
    def handleBug(self, bug_id):
 
463
        """Maybe import a single bug.
 
464
 
 
465
        If the bug has already been imported (detected by checking for
 
466
        a bug watch), it is skipped.
 
467
        """
 
468
        logger.info('Handling Bugzilla bug %d', bug_id)
 
469
 
 
470
        # is there a bug watch on the bug?
 
471
        lp_bug = self.bugset.queryByRemoteBug(self.bugtracker, bug_id)
 
472
 
 
473
        # if we already have an associated bug, don't add a new one.
 
474
        if lp_bug is not None:
 
475
            logger.info('Bugzilla bug %d is already being watched by '
 
476
                        'Launchpad bug %d', bug_id, lp_bug.id)
 
477
            return lp_bug
 
478
 
 
479
        bug = Bug(self.backend, bug_id)
 
480
 
 
481
        comments = bug.comments[:]
 
482
 
 
483
        # create a message for the initial comment:
 
484
        msgset = getUtility(IMessageSet)
 
485
        who, when, text = comments.pop(0)
 
486
        text = self._bug_re.sub(self.replaceBugRef, text)
 
487
        # If a URL is associated with the bug, add it to the description:
 
488
        if bug.bug_file_loc:
 
489
            text = text + '\n\n' + bug.bug_file_loc
 
490
        # the initial comment can't be empty:
 
491
        if not text.strip():
 
492
            text = '<empty comment>'
 
493
        msg = msgset.fromText(bug.short_desc, text, self.person(who), when)
 
494
 
 
495
        # create the bug
 
496
        target = self.getLaunchpadBugTarget(bug)
 
497
        params = CreateBugParams(
 
498
            msg=msg, datecreated=bug.creation_ts, title=bug.short_desc,
 
499
            owner=self.person(bug.reporter))
 
500
        params.setBugTarget(**target)
 
501
        lp_bug = self.bugset.createBug(params)
 
502
 
 
503
        # add the bug watch:
 
504
        lp_bug.addWatch(self.bugtracker, str(bug.bug_id), lp_bug.owner)
 
505
 
 
506
        # add remaining comments, and add CVEs found in all text
 
507
        lp_bug.findCvesInText(text, lp_bug.owner)
 
508
        for (who, when, text) in comments:
 
509
            text = self._bug_re.sub(self.replaceBugRef, text)
 
510
            msg = msgset.fromText(msg.followup_title, text,
 
511
                                  self.person(who), when)
 
512
            lp_bug.linkMessage(msg)
 
513
 
 
514
        # subscribe QA contact and CC's
 
515
        if bug.qa_contact:
 
516
            lp_bug.subscribe(
 
517
                self.person(bug.qa_contact), self.person(bug.reporter))
 
518
        for cc in bug.ccs:
 
519
            lp_bug.subscribe(self.person(cc), self.person(bug.reporter))
 
520
 
 
521
        # translate bugzilla status and severity to LP equivalents
 
522
        task = lp_bug.bugtasks[0]
 
523
        task.datecreated = bug.creation_ts
 
524
        task.transitionToAssignee(self.person(bug.assigned_to))
 
525
        task.statusexplanation = bug.status_whiteboard
 
526
        bug.mapSeverity(task)
 
527
        bug.mapStatus(task)
 
528
 
 
529
        # bugs with an alias of the form "deb1234" have been imported
 
530
        # from the Debian bug tracker by the "debzilla" program.  For
 
531
        # these bugs, generate a task and watch on the corresponding
 
532
        # bugs.debian.org bug.
 
533
        if bug.alias:
 
534
            if re.match(r'^deb\d+$', bug.alias):
 
535
                watch = self.bugwatchset.createBugWatch(
 
536
                    lp_bug, lp_bug.owner, self.debbugs, bug.alias[3:])
 
537
                debtarget = self.debian
 
538
                if target['sourcepackagename']:
 
539
                    debtarget = debtarget.getSourcePackage(
 
540
                        target['sourcepackagename'])
 
541
                debtask = self.bugtaskset.createTask(
 
542
                    lp_bug, lp_bug.owner, debtarget)
 
543
                debtask.datecreated = bug.creation_ts
 
544
                debtask.bugwatch = watch
 
545
            else:
 
546
                # generate a Launchpad name from the alias:
 
547
                name = re.sub(r'[^a-z0-9\+\.\-]', '-', bug.alias.lower())
 
548
                lp_bug.name = name
 
549
 
 
550
        # for UPSTREAM bugs, try to find whether the URL field contains
 
551
        # a bug reference.
 
552
        if bug.bug_status == 'UPSTREAM':
 
553
            # see if the URL field contains a bug tracker reference
 
554
            watches = self.bugwatchset.fromText(bug.bug_file_loc,
 
555
                                                lp_bug, lp_bug.owner)
 
556
            # find the upstream product for this bug
 
557
            product = self.getLaunchpadUpstreamProduct(bug)
 
558
 
 
559
            # if we created a watch, and there is an upstream product,
 
560
            # create a new task and link it to the watch.
 
561
            if len(watches) > 0:
 
562
                if product:
 
563
                    upstreamtask = self.bugtaskset.createTask(
 
564
                        lp_bug, lp_bug.owner, product)
 
565
                    upstreamtask.datecreated = bug.creation_ts
 
566
                    upstreamtask.bugwatch = watches[0]
 
567
                else:
 
568
                    logger.warning('Could not find upstream product to link '
 
569
                                   'bug %d to', lp_bug.id)
 
570
 
 
571
        # translate milestone linkage
 
572
        task.milestone = self.getLaunchpadMilestone(bug)
 
573
 
 
574
        # import attachments
 
575
        for (attach_id, creation_ts, description, mimetype, ispatch,
 
576
             filename, thedata, submitter_id) in bug.attachments:
 
577
            # if the filename is missing for some reason, use a generic one.
 
578
            if filename is None or filename.strip() == '':
 
579
                filename = 'untitled'
 
580
            logger.debug('Creating attachment %s for bug %d',
 
581
                         filename, bug.bug_id)
 
582
            if ispatch:
 
583
                attach_type = BugAttachmentType.PATCH
 
584
                mimetype = 'text/plain'
 
585
            else:
 
586
                attach_type = BugAttachmentType.UNSPECIFIED
 
587
 
 
588
            # look for a message starting with "Created an attachment (id=NN)"
 
589
            for msg in lp_bug.messages:
 
590
                if msg.text_contents.startswith(
 
591
                        'Created an attachment (id=%d)' % attach_id):
 
592
                    break
 
593
            else:
 
594
                # could not find the add message, so create one:
 
595
                msg = msgset.fromText(description,
 
596
                                      'Created attachment %s' % filename,
 
597
                                      self.person(submitter_id),
 
598
                                      creation_ts)
 
599
                lp_bug.linkMessage(msg)
 
600
 
 
601
            filealias = getUtility(ILibraryFileAliasSet).create(
 
602
                name=filename,
 
603
                size=len(thedata),
 
604
                file=StringIO(thedata),
 
605
                contentType=mimetype)
 
606
 
 
607
            getUtility(IBugAttachmentSet).create(
 
608
                bug=lp_bug, filealias=filealias, attach_type=attach_type,
 
609
                title=description, message=msg)
 
610
 
 
611
        return lp_bug
 
612
 
 
613
    def processDuplicates(self, trans):
 
614
        """Mark Launchpad bugs as duplicates based on Bugzilla duplicates.
 
615
 
 
616
        Launchpad bug A will be marked as a duplicate of bug B if:
 
617
         * bug A watches bugzilla bug A'
 
618
         * bug B watches bugzilla bug B'
 
619
         * bug A' is a duplicate of bug B'
 
620
         * bug A is not currently a duplicate of any other bug.
 
621
        """
 
622
 
 
623
        logger.info('Processing duplicate bugs')
 
624
        bugmap = {}
 
625
 
 
626
        def getlpbug(bugid):
 
627
            """Get the Launchpad bug corresponding to the given remote ID
 
628
 
 
629
            This function makes use of a cache dictionary to reduce the
 
630
            number of lookups.
 
631
            """
 
632
            lpbugid = bugmap.get(bugid)
 
633
            if lpbugid is not None:
 
634
                if lpbugid != 0:
 
635
                    lpbug = self.bugset.get(lpbugid)
 
636
                else:
 
637
                    lpbug = None
 
638
            else:
 
639
                lpbug = self.bugset.queryByRemoteBug(self.bugtracker, bugid)
 
640
                if lpbug is not None:
 
641
                    bugmap[bugid] = lpbug.id
 
642
                else:
 
643
                    bugmap[bugid] = 0
 
644
            return lpbug
 
645
 
 
646
        for (dupe_of, dupe) in self.backend.getDuplicates():
 
647
            # get the Launchpad bugs corresponding to the two Bugzilla bugs:
 
648
            trans.begin()
 
649
            lpdupe_of = getlpbug(dupe_of)
 
650
            lpdupe = getlpbug(dupe)
 
651
            # if both bugs exist in Launchpad, and lpdupe is not already
 
652
            # a duplicate, mark it as a duplicate of lpdupe_of.
 
653
            if (lpdupe_of is not None and lpdupe is not None and
 
654
                lpdupe.duplicateof is None):
 
655
                logger.info('Marking %d as a duplicate of %d',
 
656
                            lpdupe.id, lpdupe_of.id)
 
657
                lpdupe.markAsDuplicate(lpdupe_of)
 
658
            trans.commit()
 
659
 
 
660
    def importBugs(self, trans, product=None, component=None, status=None):
 
661
        """Import Bugzilla bugs matching the given constraints.
 
662
 
 
663
        Each of product, component and status gives a list of
 
664
        products, components or statuses to limit the import to.  An
 
665
        empty list matches all products, components or statuses.
 
666
        """
 
667
        if product is None:
 
668
            product = []
 
669
        if component is None:
 
670
            component = []
 
671
        if status is None:
 
672
            status = []
 
673
 
 
674
        bugs = self.backend.findBugs(product=product,
 
675
                                     component=component,
 
676
                                     status=status)
 
677
        for bug_id in bugs:
 
678
            trans.begin()
 
679
            try:
 
680
                self.handleBug(bug_id)
 
681
            except (SystemExit, KeyboardInterrupt):
 
682
                raise
 
683
            except:
 
684
                logger.exception('Could not import Bugzilla bug #%d', bug_id)
 
685
                trans.abort()
 
686
            else:
 
687
                trans.commit()