~loggerhead-team/loggerhead/trunk-rich

« back to all changes in this revision

Viewing changes to loggerhead/history.py

Committer: Robey Pointer
Date: 2006-12-24 07:04:28 UTC
Revision ID: robey@lag.net-20061224070428-u2tbimufx0m1v16t

add the actual 1.0 release

files added:
.project

dev.cfg

homepage

homepage/download

homepage/download/loggerhead-1.0-0.13.tar.gz

homepage/index.html

homepage/loggerhead-background.png

homepage/loggerhead-logo-medium.png

homepage/loggerhead.css

homepage/sphere.png

loggerhead/branchview.py

loggerhead/config

loggerhead/config/__init__.py

loggerhead/config/app.cfg

loggerhead/config/log.cfg

loggerhead/controllers/bundle_ui.py

loggerhead/json.py

loggerhead/model.py

loggerhead/release.py

loggerhead/sqlobject-history

loggerhead/static/css/style.css

loggerhead/static/images/bazaar-banner.png

loggerhead/static/images/favicon.ico

loggerhead/static/images/feed-icon-16x16.gif

loggerhead/static/images/header_inner.png

loggerhead/static/images/info.png

loggerhead/static/images/loggerhead-banner.png

loggerhead/static/images/nav-small-down.gif

loggerhead/static/images/nav-small-right.gif

loggerhead/static/images/ok.png

loggerhead/static/images/tg_under_the_hood.png

loggerhead/static/images/under_the_hood_blue.png

loggerhead/templates/annotate.kid

loggerhead/templates/atom.kid

loggerhead/templates/browse.kid

loggerhead/templates/changelog.kid

loggerhead/templates/inventory.kid

loggerhead/templates/login.kid

loggerhead/templates/master.kid

loggerhead/templates/revision.kid

loggerhead/templates/welcome.kid

loggerhead/tests/test_controllers.py

loggerhead/tests/test_model.py

loggerhead/textindex.py

sample-prod.cfg

files removed:
COPYING.txt

NEWS

loggerhead/apps

loggerhead/apps/__init__.py

loggerhead/apps/branch.py

loggerhead/apps/config.py

loggerhead/apps/filesystem.py

loggerhead/controllers/diff_ui.py

loggerhead/controllers/directory_ui.py

loggerhead/controllers/search_ui.py

loggerhead/daemon.py

loggerhead/lockfile.py

loggerhead/search.py

loggerhead/static/css/annotate.css

loggerhead/static/css/diff.css

loggerhead/static/css/files.css

loggerhead/static/css/global.css

loggerhead/static/images/bg_Tabs.gif

loggerhead/static/images/bg_infobox.gif

loggerhead/static/images/bg_menuTabs.gif

loggerhead/static/images/bg_search_input.gif

loggerhead/static/images/bg_submenuTabs.gif

loggerhead/static/images/deleteCode.gif

loggerhead/static/images/favicon.ico

loggerhead/static/images/ico_branch.gif

loggerhead/static/images/ico_committer.gif

loggerhead/static/images/ico_description.gif

loggerhead/static/images/ico_diff.gif

loggerhead/static/images/ico_file.gif

loggerhead/static/images/ico_file_download.gif

loggerhead/static/images/ico_file_flecha.gif

loggerhead/static/images/ico_file_modify.gif

loggerhead/static/images/ico_folder.gif

loggerhead/static/images/ico_folder_up.gif

loggerhead/static/images/ico_link.gif

loggerhead/static/images/ico_mergefrom.gif

loggerhead/static/images/ico_mergeto.gif

loggerhead/static/images/ico_planilla.gif

loggerhead/static/images/ico_rss.gif

loggerhead/static/images/ico_time.gif

loggerhead/static/images/newCode.gif

loggerhead/static/images/treeCollapsed.png

loggerhead/static/images/treeDiff.png

loggerhead/static/images/treeExpanded.png

loggerhead/static/javascript/custom.js

loggerhead/static/javascript/mootools-1.2-core.js

loggerhead/static/javascript/mootools-1.2-more.js

loggerhead/templatefunctions.py

loggerhead/templates/annotate.pt

loggerhead/templates/atom.pt

loggerhead/templates/browse.pt

loggerhead/templates/changelog.pt

loggerhead/templates/collapse-all-button.pt

loggerhead/templates/collapse-button.pt

loggerhead/templates/directory.pt

loggerhead/templates/feed-link.pt

loggerhead/templates/inventory.pt

loggerhead/templates/macros.pt

loggerhead/templates/menu.pt

loggerhead/templates/modified-file-link-rev.pt

loggerhead/templates/revision.pt

loggerhead/templates/revisionfilechanges.pt

loggerhead/templates/revisioninfo.pt

loggerhead/templates/search-box.pt

loggerhead/templates/search.pt

loggerhead/tests/simple.pt

loggerhead/tests/test_corners.py

loggerhead/tests/test_filechangecache.py

loggerhead/tests/test_simple.py

loggerhead/tests/test_templating.py

loggerhead/wholehistory.py

loggerhead/zptsupport.py

serve-branches

serve-branches.1

start-loggerhead.1

stop-loggerhead

stop-loggerhead.1

files renamed:
loggerhead.conf.example => loggerhead.conf

start-loggerhead => start-loggerhead.py

files modified:
.bzrignore

MANIFEST.in

Makefile

README.txt

loggerhead/TODO

loggerhead/__init__.py

loggerhead/changecache.py

loggerhead/controllers/__init__.py

loggerhead/controllers/annotate_ui.py

loggerhead/controllers/atom_ui.py

loggerhead/controllers/changelog_ui.py

loggerhead/controllers/download_ui.py

loggerhead/controllers/inventory_ui.py

loggerhead/controllers/revision_ui.py

loggerhead/history.py

loggerhead/lsprof.py

loggerhead/util.py

setup.py

Show diffs side-by-side

added added

removed removed

loggerhead/history.py

# (Authored by Martin Albisetti <argentina@gmail.com>)

import bisect

import cgi

import datetime

import logging

import os

import posixpath

import re

import shelve

import sys

import textwrap

import threading

import time

from StringIO import StringIO

from loggerhead import search

from loggerhead import util

from loggerhead.wholehistory import compute_whole_history_data

from loggerhead.util import decorator

import bzrlib

import bzrlib.annotate

import bzrlib.branch

import bzrlib.bundle.serializer

import bzrlib.diff

import bzrlib.errors

import bzrlib.progress

import bzrlib.revision

import bzrlib.textfile

import bzrlib.tsort

import bzrlib.ui

with_branch_lock = util.with_lock('_lock', 'branch')

@decorator

def with_bzrlib_read_lock(unbound):

def bzrlib_read_locked(self, *args, **kw):

#self.log.debug('-> %r bzr lock', id(threading.currentThread()))

self._branch.repository.lock_read()

try:

return unbound(self, *args, **kw)

finally:

self._branch.repository.unlock()

#self.log.debug('<- %r bzr lock', id(threading.currentThread()))

return bzrlib_read_locked

# bzrlib's UIFactory is not thread-safe

uihack = threading.local()

bzrlib.ui.ui_factory = ThreadSafeUIFactory()

def _process_side_by_side_buffers(line_list, delete_list, insert_list):

while len(delete_list) < len(insert_list):

delete_list.append((None, '', 'context'))

while len(insert_list) < len(delete_list):

insert_list.append((None, '', 'context'))

while len(delete_list) > 0:

d = delete_list.pop(0)

i = insert_list.pop(0)

line_list.append(util.Container(old_lineno=d[0], new_lineno=i[0],

old_line=d[1], new_line=i[1],

old_type=d[2], new_type=i[2]))

def _make_side_by_side(chunk_list):

"""

turn a normal unified-style diff (post-processed by parse_delta) into a

side-by-side diff structure. the new structure is::

chunks: list(

diff: list(

old_lineno: int,

new_lineno: int,

old_line: str,

new_line: str,

type: str('context' or 'changed'),

)

"""

out_chunk_list = []

for chunk in chunk_list:

line_list = []

wrap_char = '<wbr/>'

delete_list, insert_list = [], []

for line in chunk.diff:

# Add <wbr/> every X characters so we can wrap properly

100

wrap_line = re.findall(r'.{%d}|.+$' % 78, line.line)

101

wrap_lines = [util.html_clean(_line) for _line in wrap_line]

102

wrapped_line = wrap_char.join(wrap_lines)

103

104

if line.type == 'context':

105

if len(delete_list) or len(insert_list):

106

_process_side_by_side_buffers(line_list, delete_list,

107

insert_list)

108

delete_list, insert_list = [], []

109

line_list.append(util.Container(old_lineno=line.old_lineno,

110

new_lineno=line.new_lineno,

111

old_line=wrapped_line,

112

new_line=wrapped_line,

113

old_type=line.type,

114

new_type=line.type))

115

elif line.type == 'delete':

116

delete_list.append((line.old_lineno, wrapped_line, line.type))

117

elif line.type == 'insert':

118

insert_list.append((line.new_lineno, wrapped_line, line.type))

119

if len(delete_list) or len(insert_list):

120

_process_side_by_side_buffers(line_list, delete_list, insert_list)

121

out_chunk_list.append(util.Container(diff=line_list))

122

return out_chunk_list

123

124

125

def is_branch(folder):

126

try:

127

bzrlib.branch.Branch.open(folder)

128

return True

129

except:

130

return False

131

132

133

def clean_message(message):

134

"""Clean up a commit message and return it and a short (1-line) version.

135

136

Commit messages that are long single lines are reflowed using the textwrap

137

module (Robey, the original author of this code, apparently favored this

138

style of message).

139

"""

140

message = message.splitlines()

141

142

if len(message) == 1:

143

message = textwrap.wrap(message[0])

144

145

if len(message) == 0:

146

# We can end up where when (a) the commit message was empty or (b)

147

# when the message consisted entirely of whitespace, in which case

148

# textwrap.wrap() returns an empty list.

149

return [''], ''

150

151

# Make short form of commit message.

152

short_message = message[0]

153

if len(short_message) > 60:

154

short_message = short_message[:60] + '...'

155

156

return message, short_message

157

158

159

def rich_filename(path, kind):

160

if kind == 'directory':

161

path += '/'

162

if kind == 'symlink':

163

path += '@'

164

return path

165

166

167

168

# from bzrlib

169

class _RevListToTimestamps(object):

170

"""This takes a list of revisions, and allows you to bisect by date"""

184

101

185

102

186

103

class History (object):

187

"""Decorate a branch to provide information for rendering.

188

189

History objects are expected to be short lived -- when serving a request

190

for a particular branch, open it, read-lock it, wrap a History object

191

around it, serve the request, throw the History object away, unlock the

192

branch and throw it away.

193

194

:ivar _file_change_cache: xx

195

"""

196

197

def __init__(self, branch, whole_history_data_cache):

198

assert branch.is_locked(), (

199

"Can only construct a History object with a read-locked branch.")

200

self._file_change_cache = None

104

105

def __init__(self):

106

self._change_cache = None

107

self._index = None

108

self._lock = threading.RLock()

109

110

@classmethod

111

def from_branch(cls, branch, name=None):

112

z = time.time()

113

self = cls()

201

114

self._branch = branch

202

self.log = logging.getLogger('loggerhead.%s' % (branch.nick,))

203

204

self.last_revid = branch.last_revision()

205

206

whole_history_data = whole_history_data_cache.get(self.last_revid)

207

if whole_history_data is None:

208

whole_history_data = compute_whole_history_data(branch)

209

whole_history_data_cache[self.last_revid] = whole_history_data

210

211

(self._revision_graph, self._full_history, self._revision_info,

212

self._revno_revid, self._merge_sort, self._where_merged

213

) = whole_history_data

214

215

def use_file_cache(self, cache):

216

self._file_change_cache = cache

217

218

@property

219

def has_revisions(self):

220

return not bzrlib.revision.is_null(self.last_revid)

221

222

def get_config(self):

223

return self._branch.get_config()

224

115

self._history = branch.revision_history()

116

self._last_revid = self._history[-1]

117

self._revision_graph = branch.repository.get_revision_graph(self._last_revid)

118

119

if name is None:

120

name = self._branch.nick

121

self._name = name

122

self.log = logging.getLogger('loggerhead.%s' % (name,))

123

124

self._full_history = []

125

self._revision_info = {}

126

self._revno_revid = {}

127

self._merge_sort = bzrlib.tsort.merge_sort(self._revision_graph, self._last_revid, generate_revno=True)

128

count = 0

129

for (seq, revid, merge_depth, revno, end_of_merge) in self._merge_sort:

130

self._full_history.append(revid)

131

revno_str = '.'.join(str(n) for n in revno)

132

self._revno_revid[revno_str] = revid

133

self._revision_info[revid] = (seq, revid, merge_depth, revno_str, end_of_merge)

134

count += 1

135

self._count = count

136

137

# cache merge info

138

self._where_merged = {}

139

for revid in self._revision_graph.keys():

140

if not revid in self._full_history:

141

continue

142

for parent in self._revision_graph[revid]:

143

self._where_merged.setdefault(parent, set()).add(revid)

144

145

self.log.info('built revision graph cache: %r secs' % (time.time() - z,))

146

return self

147

148

@classmethod

149

def from_folder(cls, path, name=None):

150

b = bzrlib.branch.Branch.open(path)

151

return cls.from_branch(b, name)

152

153

@with_branch_lock

154

def out_of_date(self):

155

if self._branch.revision_history()[-1] != self._last_revid:

156

return True

157

return False

158

159

def use_cache(self, cache):

160

self._change_cache = cache

161

162

def use_search_index(self, index):

163

self._index = index

164

165

@with_branch_lock

166

def detach(self):

167

# called when a new history object needs to be created, because the

168

# branch history has changed. we need to immediately close and stop

169

# using our caches, because a new history object will be created to

170

# replace us, using the same cache files.

171

if self._change_cache is not None:

172

self._change_cache.close()

173

self._change_cache = None

174

if self._index is not None:

175

self._index.close()

176

self._index = None

177

178

def flush_cache(self):

179

if self._change_cache is None:

180

return

181

self._change_cache.flush()

182

183

def check_rebuild(self):

184

if self._change_cache is not None:

185

self._change_cache.check_rebuild()

186

if self._index is not None:

187

self._index.check_rebuild()

188

189

last_revid = property(lambda self: self._last_revid, None, None)

190

191

count = property(lambda self: self._count, None, None)

192

193

@with_branch_lock

194

def get_revision(self, revid):

195

return self._branch.repository.get_revision(revid)

196

225

197

def get_revno(self, revid):

226

198

if revid not in self._revision_info:

227

199

# ghost parent?

229

201

seq, revid, merge_depth, revno_str, end_of_merge = self._revision_info[revid]

230

202

return revno_str

231

203

232

def get_revids_from(self, revid_list, start_revid):

233

"""

234

Yield the mainline (wrt start_revid) revisions that merged each

235

revid in revid_list.

236

"""

237

if revid_list is None:

238

revid_list = self._full_history

239

revid_set = set(revid_list)

240

revid = start_revid

241

def introduced_revisions(revid):

242

r = set([revid])

243

seq, revid, md, revno, end_of_merge = self._revision_info[revid]

244

i = seq + 1

245

while i < len(self._merge_sort) and self._merge_sort[i][2] > md:

246

r.add(self._merge_sort[i][1])

247

i += 1

248

return r

249

while 1:

250

if bzrlib.revision.is_null(revid):

251

return

252

if introduced_revisions(revid) & revid_set:

204

def get_sequence(self, revid):

205

seq, revid, merge_depth, revno_str, end_of_merge = self._revision_info[revid]

206

return seq

207

208

def get_revision_history(self):

209

return self._full_history

210

211

def get_revid_sequence(self, revid_list, revid):

212

"""

213

given a list of revision ids, return the sequence # of this revid in

214

the list.

215

"""

216

seq = 0

217

for r in revid_list:

218

if revid == r:

219

return seq

220

seq += 1

221

222

def get_revids_from(self, revid_list, revid):

223

"""

224

given a list of revision ids, yield revisions in graph order,

225

starting from revid. the list can be None if you just want to travel

226

across all revisions.

227

"""

228

while True:

229

if (revid_list is None) or (revid in revid_list):

253

230

yield revid

231

if not self._revision_graph.has_key(revid):

232

return

254

233

parents = self._revision_graph[revid]

255

234

if len(parents) == 0:

256

235

return

257

236

revid = parents[0]

258

237

238

@with_branch_lock

259

239

def get_short_revision_history_by_fileid(self, file_id):

240

# wow. is this really the only way we can get this list? by

241

# man-handling the weave store directly? :-0

260

242

# FIXME: would be awesome if we could get, for a folder, the list of

261

# revisions where items within that folder changed.i

262

try:

263

# FIXME: Workaround for bzr versions prior to 1.6b3.

264

# Remove me eventually pretty please :)

265

w = self._branch.repository.weave_store.get_weave(file_id, self._branch.repository.get_transaction())

266

w_revids = w.versions()

267

revids = [r for r in self._full_history if r in w_revids]

268

except AttributeError:

269

possible_keys = [(file_id, revid) for revid in self._full_history]

270

existing_keys = self._branch.repository.texts.get_parent_map(possible_keys)

271

revids = [revid for _, revid in existing_keys.iterkeys()]

243

# revisions where items within that folder changed.

244

w = self._branch.repository.weave_store.get_weave(file_id, self._branch.repository.get_transaction())

245

w_revids = w.versions()

246

revids = [r for r in self._full_history if r in w_revids]

272

247

return revids

273

248

249

@with_branch_lock

274

250

def get_revision_history_since(self, revid_list, date):

275

251

# if a user asks for revisions starting at 01-sep, they mean inclusive,

276

252

# so start at midnight on 02-sep.

283

259

revid_list.reverse()

284

260

index = -index

285

261

return revid_list[index:]

262

263

@with_branch_lock

264

def get_revision_history_matching(self, revid_list, text):

265

self.log.debug('searching %d revisions for %r', len(revid_list), text)

266

z = time.time()

267

# this is going to be painfully slow. :(

268

out = []

269

text = text.lower()

270

for revid in revid_list:

271

change = self.get_changes([ revid ])[0]

272

if text in change.comment.lower():

273

out.append(revid)

274

self.log.debug('searched %d revisions for %r in %r secs', len(revid_list), text, time.time() - z)

275

return out

286

276

277

def get_revision_history_matching_indexed(self, revid_list, text):

278

self.log.debug('searching %d revisions for %r', len(revid_list), text)

279

z = time.time()

280

if self._index is None:

281

return self.get_revision_history_matching(revid_list, text)

282

out = self._index.find(text, revid_list)

283

self.log.debug('searched %d revisions for %r in %r secs: %d results', len(revid_list), text, time.time() - z, len(out))

284

# put them in some coherent order :)

285

out = [r for r in self._full_history if r in out]

286

return out

287

288

@with_branch_lock

287

289

def get_search_revid_list(self, query, revid_list):

288

290

"""

289

291

given a "quick-search" query, try a few obvious possible meanings:

290

292

291

293

- revision id or # ("128.1.3")

292

294

- date (US style "mm/dd/yy", earth style "dd-mm-yy", or iso style "yyyy-mm-dd")

293

295

- comment text as a fallback

297

299

# FIXME: there is some silliness in this action. we have to look up

298

300

# all the relevant changes (time-consuming) only to return a list of

299

301

# revids which will be used to fetch a set of changes again.

300

302

301

303

# if they entered a revid, just jump straight there; ignore the passed-in revid_list

302

304

revid = self.fix_revid(query)

303

305

if revid is not None:

304

if isinstance(revid, unicode):

305

revid = revid.encode('utf-8')

306

changes = self.get_changes([ revid ])

307

if (changes is not None) and (len(changes) > 0):

308

return [ revid ]

309

310

date = None

311

m = self.us_date_re.match(query)

312

if m is not None:

322

if date is not None:

323

if revid_list is None:

324

# if no limit to the query was given, search only the direct-parent path.

325

revid_list = list(self.get_revids_from(None, self.last_revid))

325

revid_list = list(self.get_revids_from(None, self._last_revid))

326

return self.get_revision_history_since(revid_list, date)

327

328

# check comment fields.

329

if revid_list is None:

330

revid_list = self._full_history

331

return self.get_revision_history_matching_indexed(revid_list, query)

332

328

333

revno_re = re.compile(r'^[\d\.]+$')

329

334

# the date regex are without a final '$' so that queries like

330

335

# "2006-11-30 12:15" still mostly work. (i think it's better to give

337

342

# if a "revid" is actually a dotted revno, convert it to a revid

338

343

if revid is None:

339

344

return revid

340

if revid == 'head:':

341

return self.last_revid

342

345

if self.revno_re.match(revid):

343

346

revid = self._revno_revid[revid]

344

347

return revid

345

348

349

@with_branch_lock

346

350

def get_file_view(self, revid, file_id):

347

351

"""

348

Given a revid and optional path, return a (revlist, revid) for

349

navigation through the current scope: from the revid (or the latest

350

revision) back to the original revision.

351

352

Given an optional revid and optional path, return a (revlist, revid)

353

for navigation through the current scope: from the revid (or the

354

latest revision) back to the original revision.

355

352

356

If file_id is None, the entire revision history is the list scope.

357

If revid is None, the latest revision is used.

353

358

"""

354

359

if revid is None:

355

revid = self.last_revid

360

revid = self._last_revid

356

361

if file_id is not None:

357

# since revid is 'start_revid', possibly should start the path

358

# tracing from revid... FIXME

362

# since revid is 'start_revid', possibly should start the path tracing from revid... FIXME

363

inv = self._branch.repository.get_revision_inventory(revid)

359

364

revlist = list(self.get_short_revision_history_by_fileid(file_id))

360

365

revlist = list(self.get_revids_from(revlist, revid))

361

366

else:

362

367

revlist = list(self.get_revids_from(None, revid))

363

return revlist

364

368

if revid is None:

369

revid = revlist[0]

370

return revlist, revid

371

372

@with_branch_lock

365

373

def get_view(self, revid, start_revid, file_id, query=None):

366

374

"""

367

375

use the URL parameters (revid, start_revid, file_id, and query) to

368

376

determine the revision list we're viewing (start_revid, file_id, query)

369

377

and where we are in it (revid).

370

371

- if a query is given, we're viewing query results.

372

- if a file_id is given, we're viewing revisions for a specific

373

file.

374

- if a start_revid is given, we're viewing the branch from a

375

specific revision up the tree.

376

377

these may be combined to view revisions for a specific file, from

378

a specific revision, with a specific search query.

379

380

returns a new (revid, start_revid, revid_list) where:

381

378

379

if a query is given, we're viewing query results.

380

if a file_id is given, we're viewing revisions for a specific file.

381

if a start_revid is given, we're viewing the branch from a

382

specific revision up the tree.

383

(these may be combined to view revisions for a specific file, from

384

a specific revision, with a specific search query.)

385

386

returns a new (revid, start_revid, revid_list, scan_list) where:

387

382

388

- revid: current position within the view

383

389

- start_revid: starting revision of this view

384

390

- revid_list: list of revision ids for this view

385

391

386

392

file_id and query are never changed so aren't returned, but they may

387

393

contain vital context for future url navigation.

388

394

"""

389

if start_revid is None:

390

start_revid = self.last_revid

391

392

395

if query is None:

393

revid_list = self.get_file_view(start_revid, file_id)

396

revid_list, start_revid = self.get_file_view(start_revid, file_id)

394

397

if revid is None:

395

398

revid = start_revid

396

399

if revid not in revid_list:

397

400

# if the given revid is not in the revlist, use a revlist that

398

401

# starts at the given revid.

399

revid_list = self.get_file_view(revid, file_id)

400

start_revid = revid

402

revid_list, start_revid = self.get_file_view(revid, file_id)

401

403

return revid, start_revid, revid_list

402

404

403

405

# potentially limit the search

404

if file_id is not None:

405

revid_list = self.get_file_view(start_revid, file_id)

406

if (start_revid is not None) or (file_id is not None):

407

revid_list, start_revid = self.get_file_view(start_revid, file_id)

406

408

else:

407

409

revid_list = None

408

revid_list = search.search_revisions(self._branch, query)

409

if revid_list and len(revid_list) > 0:

410

411

revid_list = self.get_search_revid_list(query, revid_list)

412

if len(revid_list) > 0:

410

413

if revid not in revid_list:

411

414

revid = revid_list[0]

412

415

return revid, start_revid, revid_list

413

416

else:

414

# XXX: This should return a message saying that the search could

415

# not be completed due to either missing the plugin or missing a

416

# search index.

417

# no results

417

418

return None, None, []

418

419

420

@with_branch_lock

419

421

def get_inventory(self, revid):

420

422

return self._branch.repository.get_revision_inventory(revid)

421

423

424

@with_branch_lock

422

425

def get_path(self, revid, file_id):

423

426

if (file_id is None) or (file_id == ''):

424

427

return ''

426

429

if (len(path) > 0) and not path.startswith('/'):

427

430

path = '/' + path

428

431

return path

429

430

def get_file_id(self, revid, path):

431

if (len(path) > 0) and not path.startswith('/'):

432

path = '/' + path

433

return self._branch.repository.get_revision_inventory(revid).path2id(path)

434

432

433

def get_where_merged(self, revid):

434

try:

435

return self._where_merged[revid]

436

except:

437

return []

438

435

439

def get_merge_point_list(self, revid):

436

440

"""

437

441

Return the list of revids that have merged this node.

438

442

"""

439

if '.' not in self.get_revno(revid):

443

if revid in self._history:

440

444

return []

441

445

442

446

merge_point = []

443

447

while True:

444

children = self._where_merged.get(revid, [])

448

children = self.get_where_merged(revid)

445

449

nexts = []

446

450

for child in children:

447

451

child_parents = self._revision_graph[child]

461

465

merge_point.extend(merge_point_next)

462

466

463

467

revid = nexts[0]

464

468

465

469

def simplify_merge_point_list(self, revids):

466

470

"""if a revision is already merged, don't show further merge points"""

467

471

d = {}

493

497

p_changes = self.get_changes(list(fetch_set))

494

498

p_change_dict = dict([(c.revid, c) for c in p_changes])

495

499

for change in changes:

496

# arch-converted branches may not have merged branch info :(

497

500

for p in change.parents:

498

if p.revid in p_change_dict:

499

p.branch_nick = p_change_dict[p.revid].branch_nick

500

else:

501

p.branch_nick = '(missing)'

501

p.branch_nick = p_change_dict[p.revid].branch_nick

502

for p in change.merge_points:

503

if p.revid in p_change_dict:

504

p.branch_nick = p_change_dict[p.revid].branch_nick

505

else:

506

p.branch_nick = '(missing)'

507

508

def get_changes(self, revid_list):

509

"""Return a list of changes objects for the given revids.

510

511

Revisions not present and NULL_REVISION will be ignored.

512

"""

513

changes = self.get_changes_uncached(revid_list)

514

if len(changes) == 0:

503

p.branch_nick = p_change_dict[p.revid].branch_nick

504

505

@with_branch_lock

506

def get_changes(self, revid_list, get_diffs=False):

507

if self._change_cache is None:

508

changes = self.get_changes_uncached(revid_list, get_diffs)

509

else:

510

changes = self._change_cache.get_changes(revid_list, get_diffs)

511

if changes is None:

515

512

return changes

516

513

517

514

# some data needs to be recalculated each time, because it may

518

515

# change as new revisions are added.

519

for change in changes:

520

merge_revids = self.simplify_merge_point_list(self.get_merge_point_list(change.revid))

516

for i in xrange(len(revid_list)):

517

revid = revid_list[i]

518

change = changes[i]

519

merge_revids = self.simplify_merge_point_list(self.get_merge_point_list(revid))

521

520

change.merge_points = [util.Container(revid=r, revno=self.get_revno(r)) for r in merge_revids]

522

if len(change.parents) > 0:

523

change.parents = [util.Container(revid=r,

524

revno=self.get_revno(r)) for r in change.parents]

525

change.revno = self.get_revno(change.revid)

526

527

parity = 0

528

for change in changes:

529

change.parity = parity

530

parity ^= 1

531

521

532

522

return changes

533

523

534

def get_changes_uncached(self, revid_list):

535

# FIXME: deprecated method in getting a null revision

536

revid_list = filter(lambda revid: not bzrlib.revision.is_null(revid),

537

revid_list)

538

parent_map = self._branch.repository.get_graph().get_parent_map(revid_list)

539

# We need to return the answer in the same order as the input,

540

# less any ghosts.

541

present_revids = [revid for revid in revid_list

542

if revid in parent_map]

543

rev_list = self._branch.repository.get_revisions(present_revids)

544

545

return [self._change_from_revision(rev) for rev in rev_list]

546

547

def _get_deltas_for_revisions_with_trees(self, revisions):

548

"""Produce a list of revision deltas.

549

550

Note that the input is a sequence of REVISIONS, not revision_ids.

551

Trees will be held in memory until the generator exits.

552

Each delta is relative to the revision's lefthand predecessor.

553

(This is copied from bzrlib.)

554

"""

555

required_trees = set()

556

for revision in revisions:

557

required_trees.add(revision.revid)

558

required_trees.update([p.revid for p in revision.parents[:1]])

559

trees = dict((t.get_revision_id(), t) for

560

t in self._branch.repository.revision_trees(required_trees))

561

ret = []

562

self._branch.repository.lock_read()

524

# alright, let's profile this sucka.

525

def _get_changes_profiled(self, revid_list, get_diffs=False):

526

from loggerhead.lsprof import profile

527

import cPickle

528

ret, stats = profile(self.get_changes_uncached, revid_list, get_diffs)

529

stats.sort()

530

stats.freeze()

531

cPickle.dump(stats, open('lsprof.stats', 'w'), 2)

532

return ret

533

534

@with_branch_lock

535

@with_bzrlib_read_lock

536

def get_changes_uncached(self, revid_list, get_diffs=False):

563

537

try:

564

for revision in revisions:

565

if not revision.parents:

566

old_tree = self._branch.repository.revision_tree(

567

bzrlib.revision.NULL_REVISION)

568

else:

569

old_tree = trees[revision.parents[0].revid]

570

tree = trees[revision.revid]

571

ret.append(tree.changes_from(old_tree))

572

return ret

573

finally:

574

self._branch.repository.unlock()

575

576

def _change_from_revision(self, revision):

577

"""

578

Given a bzrlib Revision, return a processed "change" for use in

579

templates.

580

"""

581

commit_time = datetime.datetime.fromtimestamp(revision.timestamp)

582

583

parents = [util.Container(revid=r, revno=self.get_revno(r)) for r in revision.parent_ids]

584

585

message, short_message = clean_message(revision.message)

586

587

entry = {

588

'revid': revision.revision_id,

589

'date': commit_time,

590

'author': revision.get_apparent_author(),

591

'branch_nick': revision.properties.get('branch-nick', None),

592

'short_comment': short_message,

593

'comment': revision.message,

594

'comment_clean': [util.html_clean(s) for s in message],

595

'parents': revision.parent_ids,

596

}

597

return util.Container(entry)

598

599

def get_file_changes_uncached(self, entries):

600

delta_list = self._get_deltas_for_revisions_with_trees(entries)

601

602

return [self.parse_delta(delta) for delta in delta_list]

603

604

def get_file_changes(self, entries):

605

if self._file_change_cache is None:

606

return self.get_file_changes_uncached(entries)

607

else:

608

return self._file_change_cache.get_file_changes(entries)

609

610

def add_changes(self, entries):

611

changes_list = self.get_file_changes(entries)

612

613

for entry, changes in zip(entries, changes_list):

614

entry.changes = changes

615

616

def get_change_with_diff(self, revid, compare_revid=None):

617

change = self.get_changes([revid])[0]

618

619

if compare_revid is None:

620

if change.parents:

621

compare_revid = change.parents[0].revid

538

rev_list = self._branch.repository.get_revisions(revid_list)

539

except (KeyError, bzrlib.errors.NoSuchRevision):

540

return None

541

542

delta_list = self._branch.repository.get_deltas_for_revisions(rev_list)

543

combined_list = zip(rev_list, delta_list)

544

545

tree_map = {}

546

if get_diffs:

547

# lookup the trees for each revision, so we can calculate diffs

548

lookup_set = set()

549

for rev in rev_list:

550

lookup_set.add(rev.revision_id)

551

if len(rev.parent_ids) > 0:

552

lookup_set.add(rev.parent_ids[0])

553

tree_map = dict((t.get_revision_id(), t) for t in self._branch.repository.revision_trees(lookup_set))

554

# also the root tree, in case we hit the origin:

555

tree_map[None] = self._branch.repository.revision_tree(None)

556

557

entries = []

558

for rev, delta in combined_list:

559

commit_time = datetime.datetime.fromtimestamp(rev.timestamp)

560

561

parents = [util.Container(revid=r, revno=self.get_revno(r)) for r in rev.parent_ids]

562

563

if len(parents) == 0:

564

left_parent = None

622

565

else:

623

compare_revid = 'null:'

624

625

rev_tree1 = self._branch.repository.revision_tree(compare_revid)

626

rev_tree2 = self._branch.repository.revision_tree(revid)

627

delta = rev_tree2.changes_from(rev_tree1)

628

629

change.changes = self.parse_delta(delta)

630

change.changes.modified = self._parse_diffs(rev_tree1, rev_tree2, delta)

631

632

return change

633

566

left_parent = rev.parent_ids[0]

567

568

message = rev.message.splitlines()

569

if len(message) == 1:

570

# robey-style 1-line long message

571

message = textwrap.wrap(message[0])

572

573

# make short form of commit message

574

short_message = message[0]

575

if len(short_message) > 60:

576

short_message = short_message[:60] + '...'

577

578

old_tree, new_tree = None, None

579

if get_diffs:

580

new_tree = tree_map[rev.revision_id]

581

old_tree = tree_map[left_parent]

582

583

entry = {

584

'revid': rev.revision_id,

585

'revno': self.get_revno(rev.revision_id),

586

'date': commit_time,

587

'author': rev.committer,

588

'branch_nick': rev.properties.get('branch-nick', None),

589

'short_comment': short_message,

590

'comment': rev.message,

591

'comment_clean': [util.html_clean(s) for s in message],

592

'parents': parents,

593

'changes': self.parse_delta(delta, get_diffs, old_tree, new_tree),

594

}

595

entries.append(util.Container(entry))

596

597

return entries

598

599

@with_branch_lock

634

600

def get_file(self, file_id, revid):

635

"returns (path, filename, data)"

636

inv = self.get_inventory(revid)

637

inv_entry = inv[file_id]

601

"returns (filename, data)"

602

inv_entry = self.get_inventory(revid)[file_id]

638

603

rev_tree = self._branch.repository.revision_tree(inv_entry.revision)

639

path = inv.id2path(file_id)

640

if not path.startswith('/'):

641

path = '/' + path

642

return path, inv_entry.name, rev_tree.get_file_text(file_id)

643

644

def _parse_diffs(self, old_tree, new_tree, delta):

604

return inv_entry.name, rev_tree.get_file_text(file_id)

605

606

@with_branch_lock

607

def parse_delta(self, delta, get_diffs=True, old_tree=None, new_tree=None):

645

608

"""

646

Return a list of processed diffs, in the format::

647

648

list(

609

Return a nested data structure containing the changes in a delta::

610

611

added: list((filename, file_id)),

612

renamed: list((old_filename, new_filename, file_id)),

613

deleted: list((filename, file_id)),

614

modified: list(

649

615

filename: str,

650

616

file_id: str,

651

617

chunks: list(

657

623

658

624

659

625

)

660

"""

661

process = []

662

out = []

663

664

for old_path, new_path, fid, kind, text_modified, meta_modified in delta.renamed:

665

if text_modified:

666

process.append((old_path, new_path, fid, kind))

667

for path, fid, kind, text_modified, meta_modified in delta.modified:

668

process.append((path, path, fid, kind))

669

670

for old_path, new_path, fid, kind in process:

671

old_lines = old_tree.get_file_lines(fid)

672

new_lines = new_tree.get_file_lines(fid)

673

buffer = StringIO()

674

if old_lines != new_lines:

675

try:

676

bzrlib.diff.internal_diff(old_path, old_lines,

677

new_path, new_lines, buffer)

678

except bzrlib.errors.BinaryFile:

679

diff = ''

680

else:

681

diff = buffer.getvalue()

682

else:

683

diff = ''

684

out.append(util.Container(filename=rich_filename(new_path, kind), file_id=fid, chunks=self._process_diff(diff), raw_diff=diff))

685

686

return out

687

688

def _process_diff(self, diff):

689

# doesn't really need to be a method; could be static.

690

chunks = []

691

chunk = None

692

for line in diff.splitlines():

693

if len(line) == 0:

694

continue

695

if line.startswith('+++ ') or line.startswith('--- '):

696

continue

697

if line.startswith('@@ '):

698

# new chunk

699

if chunk is not None:

700

chunks.append(chunk)

701

chunk = util.Container()

702

chunk.diff = []

703

lines = [int(x.split(',')[0][1:]) for x in line.split(' ')[1:3]]

704

old_lineno = lines[0]

705

new_lineno = lines[1]

706

elif line.startswith(' '):

707

chunk.diff.append(util.Container(old_lineno=old_lineno,

708

new_lineno=new_lineno,

709

type='context',

710

line=line[1:]))

711

old_lineno += 1

712

new_lineno += 1

713

elif line.startswith('+'):

714

chunk.diff.append(util.Container(old_lineno=None,

715

new_lineno=new_lineno,

716

type='insert', line=line[1:]))

717

new_lineno += 1

718

elif line.startswith('-'):

719

chunk.diff.append(util.Container(old_lineno=old_lineno,

720

new_lineno=None,

721

type='delete', line=line[1:]))

722

old_lineno += 1

723

else:

724

chunk.diff.append(util.Container(old_lineno=None,

725

new_lineno=None,

726

type='unknown',

727

line=repr(line)))

728

if chunk is not None:

729

chunks.append(chunk)

730

return chunks

731

732

def parse_delta(self, delta):

733

"""

734

Return a nested data structure containing the changes in a delta::

735

736

added: list((filename, file_id)),

737

renamed: list((old_filename, new_filename, file_id)),

738

deleted: list((filename, file_id)),

739

modified: list(

740

filename: str,

741

file_id: str,

742

)

626

627

if C{get_diffs} is false, the C{chunks} will be omitted.

743

628

"""

744

629

added = []

745

630

modified = []

746

631

renamed = []

747

632

removed = []

633

634

def rich_filename(path, kind):

635

if kind == 'directory':

636

path += '/'

637

if kind == 'symlink':

638

path += '@'

639

return path

640

641

def process_diff(diff):

642

chunks = []

643

chunk = None

644

for line in diff.splitlines():

645

if len(line) == 0:

646

continue

647

if line.startswith('+++ ') or line.startswith('--- '):

648

continue

649

if line.startswith('@@ '):

650

# new chunk

651

if chunk is not None:

652

chunks.append(chunk)

653

chunk = util.Container()

654

chunk.diff = []

655

lines = [int(x.split(',')[0][1:]) for x in line.split(' ')[1:3]]

656

old_lineno = lines[0]

657

new_lineno = lines[1]

658

elif line.startswith(' '):

659

chunk.diff.append(util.Container(old_lineno=old_lineno, new_lineno=new_lineno,

660

type='context', line=util.html_clean(line[1:])))

661

old_lineno += 1

662

new_lineno += 1

663

elif line.startswith('+'):

664

chunk.diff.append(util.Container(old_lineno=None, new_lineno=new_lineno,

665

type='insert', line=util.html_clean(line[1:])))

666

new_lineno += 1

667

elif line.startswith('-'):

668

chunk.diff.append(util.Container(old_lineno=old_lineno, new_lineno=None,

669

type='delete', line=util.html_clean(line[1:])))

670

old_lineno += 1

671

else:

672

chunk.diff.append(util.Container(old_lineno=None, new_lineno=None,

673

type='unknown', line=util.html_clean(repr(line))))

674

if chunk is not None:

675

chunks.append(chunk)

676

return chunks

677

678

def handle_modify(old_path, new_path, fid, kind):

679

if not get_diffs:

680

modified.append(util.Container(filename=rich_filename(new_path, kind), file_id=fid))

681

return

682

old_lines = old_tree.get_file_lines(fid)

683

new_lines = new_tree.get_file_lines(fid)

684

buffer = StringIO()

685

bzrlib.diff.internal_diff(old_path, old_lines, new_path, new_lines, buffer)

686

diff = buffer.getvalue()

687

modified.append(util.Container(filename=rich_filename(new_path, kind), file_id=fid, chunks=process_diff(diff), raw_diff=diff))

748

688

749

689

for path, fid, kind in delta.added:

750

690

added.append((rich_filename(path, kind), fid))

751

691

752

692

for path, fid, kind, text_modified, meta_modified in delta.modified:

753

modified.append(util.Container(filename=rich_filename(path, kind), file_id=fid))

754

755

for old_path, new_path, fid, kind, text_modified, meta_modified in delta.renamed:

756

renamed.append((rich_filename(old_path, kind), rich_filename(new_path, kind), fid))

693

handle_modify(path, path, fid, kind)

694

695

for oldpath, newpath, fid, kind, text_modified, meta_modified in delta.renamed:

696

renamed.append((rich_filename(oldpath, kind), rich_filename(newpath, kind), fid))

757

697

if meta_modified or text_modified:

758

modified.append(util.Container(filename=rich_filename(new_path, kind), file_id=fid))

759

698

handle_modify(oldpath, newpath, fid, kind)

699

760

700

for path, fid, kind in delta.removed:

761

701

removed.append((rich_filename(path, kind), fid))

762

702

763

703

return util.Container(added=added, renamed=renamed, removed=removed, modified=modified)

764

704

765

@staticmethod

766

def add_side_by_side(changes):

767

# FIXME: this is a rotten API.

768

for change in changes:

769

for m in change.changes.modified:

770

m.sbs_chunks = _make_side_by_side(m.chunks)

771

772

def get_filelist(self, inv, file_id, sort_type=None):

705

@with_branch_lock

706

def get_filelist(self, inv, path, sort_type=None):

773

707

"""

774

708

return the list of all files (and their attributes) within a given

775

709

path subtree.

776

710

"""

777

778

dir_ie = inv[file_id]

779

path = inv.id2path(file_id)

711

while path.endswith('/'):

712

path = path[:-1]

713

if path.startswith('/'):

714

path = path[1:]

715

716

entries = inv.entries()

717

718

fetch_set = set()

719

for filepath, entry in entries:

720

fetch_set.add(entry.revision)

721

change_dict = dict([(c.revid, c) for c in self.get_changes(list(fetch_set))])

722

780

723

file_list = []

781

782

revid_set = set()

783

784

for filename, entry in dir_ie.children.iteritems():

785

revid_set.add(entry.revision)

786

787

change_dict = {}

788

for change in self.get_changes(list(revid_set)):

789

change_dict[change.revid] = change

790

791

for filename, entry in dir_ie.children.iteritems():

724

for filepath, entry in entries:

725

if posixpath.dirname(filepath) != path:

726

continue

727

filename = posixpath.basename(filepath)

728

rich_filename = filename

792

729

pathname = filename

793

730

if entry.kind == 'directory':

794

731

pathname += '/'

795

732

733

# last change:

796

734

revid = entry.revision

797

798

file = util.Container(

799

filename=filename, executable=entry.executable, kind=entry.kind,

800

pathname=pathname, file_id=entry.file_id, size=entry.text_size,

801

revid=revid, change=change_dict[revid])

735

change = change_dict[revid]

736

737

file = util.Container(filename=filename, rich_filename=rich_filename, executable=entry.executable, kind=entry.kind,

738

pathname=pathname, file_id=entry.file_id, size=entry.text_size, revid=revid, change=change)

802

739

file_list.append(file)

803

804

if sort_type == 'filename' or sort_type is None:

805

file_list.sort(key=lambda x: x.filename.lower()) # case-insensitive

740

741

if sort_type == 'filename':

742

file_list.sort(key=lambda x: x.filename)

806

743

elif sort_type == 'size':

807

744

file_list.sort(key=lambda x: x.size)

808

745

elif sort_type == 'date':

809

746

file_list.sort(key=lambda x: x.change.date)

810

747

811

# Always sort by kind to get directories first

812

file_list.sort(key=lambda x: x.kind != 'directory')

813

814

748

parity = 0

815

749

for file in file_list:

816

750

file.parity = parity

819

753

return file_list

820

754

821

755

822

_BADCHARS_RE = re.compile(ur'[\x00-\x08\x0b\x0e-\x1f]')

756

_BADCHARS_RE = re.compile(ur'[\x00-\x08\x0b-\x0c\x0e-\x1f]')

823

757

758

@with_branch_lock

824

759

def annotate_file(self, file_id, revid):

825

760

z = time.time()

826

761

lineno = 1

827

762

parity = 0

828

763

829

764

file_revid = self.get_inventory(revid)[file_id].revision

830

765

oldvalues = None

831

tree = self._branch.repository.revision_tree(file_revid)

766

767

# because we cache revision metadata ourselves, it's actually much

768

# faster to call 'annotate_iter' on the weave directly than it is to

769

# ask bzrlib to annotate for us.

770

w = self._branch.repository.weave_store.get_weave(file_id, self._branch.repository.get_transaction())

771

832

772

revid_set = set()

833

834

for line_revid, text in tree.annotate_iter(file_id):

773

for line_revid, text in w.annotate_iter(file_revid):

835

774

revid_set.add(line_revid)

836

775

if self._BADCHARS_RE.match(text):

837

776

# bail out; this isn't displayable text

838

777

yield util.Container(parity=0, lineno=1, status='same',

839

text='(This is a binary file.)',

778

text='<i>' + util.html_clean('(This is a binary file.)') + '</i>',

840

779

change=util.Container())

841

780

return

842

change_cache = dict([(c.revid, c) \

843

for c in self.get_changes(list(revid_set))])

844

781

change_cache = dict([(c.revid, c) for c in self.get_changes(list(revid_set))])

782

845

783

last_line_revid = None

846

for line_revid, text in tree.annotate_iter(file_id):

784

for line_revid, text in w.annotate_iter(file_revid):

847

785

if line_revid == last_line_revid:

848

786

# remember which lines have a new revno and which don't

849

787

status = 'same'

855

793

trunc_revno = change.revno

856

794

if len(trunc_revno) > 10:

857

795

trunc_revno = trunc_revno[:9] + '...'

858

796

859

797

yield util.Container(parity=parity, lineno=lineno, status=status,

860

change=change, text=util.fixed_width(text))

798

change=change, text=util.html_clean(text))

861

799

lineno += 1

862

800

863

801

self.log.debug('annotate: %r secs' % (time.time() - z,))

802

803

@with_branch_lock

804

@with_bzrlib_read_lock

805

def get_bundle(self, revid):

806

parents = self._revision_graph[revid]

807

if len(parents) > 0:

808

parent_revid = parents[0]

809

else:

810

parent_revid = None

811

s = StringIO()

812

bzrlib.bundle.serializer.write_bundle(self._branch.repository, revid, parent_revid, s)

813

return s.getvalue()

814

Older »