~loggerhead-team/loggerhead/trunk-rich

Viewing changes to loggerhead/changecache.py

Committer: Robey Pointer
Date: 2007-03-12 17:51:19 UTC
Revision ID: robey@lag.net-20070312175119-xms19elalw5ax1zc

revert the change that stopped converting spaces to ' '.
in other words, go back to doing the nbsp conversion. bug report from
kent gibson reveals that at least in firefox, the spaces aren't handled
the way i want.

files added:
loggerhead/json.py

loggerhead/model.py

loggerhead/static/css/style.css

loggerhead/static/images/bazaar-banner.png

loggerhead/static/images/favicon.ico

loggerhead/static/images/feed-icon-16x16.gif

loggerhead/static/images/header_inner.png

loggerhead/static/images/info.png

loggerhead/static/images/loggerhead-banner.png

loggerhead/static/images/nav-small-down.gif

loggerhead/static/images/nav-small-in.gif

loggerhead/static/images/nav-small-out.gif

loggerhead/static/images/nav-small-right.gif

loggerhead/static/images/ok.png

loggerhead/static/images/tg_under_the_hood.png

loggerhead/static/images/under_the_hood_blue.png

loggerhead/templates/annotate.kid

loggerhead/templates/atom.kid

loggerhead/templates/browse.kid

loggerhead/templates/changelog.kid

loggerhead/templates/inventory.kid

loggerhead/templates/master.kid

loggerhead/templates/revision.kid

loggerhead/tests/test_controllers.py

loggerhead/tests/test_model.py

files removed:
loggerhead/static/css/global.css

loggerhead/static/css/zptstyle.css

loggerhead/static/images/bg_Tabs.gif

loggerhead/static/images/bg_menuTabs.gif

loggerhead/static/images/bg_search_input.gif

loggerhead/static/images/ico_committer.gif

loggerhead/static/images/ico_description.gif

loggerhead/static/images/ico_diff.gif

loggerhead/static/images/ico_file.gif

loggerhead/static/images/ico_link

loggerhead/static/images/ico_mergefrom.gif

loggerhead/static/images/ico_rss.gif

loggerhead/templatefunctions.py

loggerhead/templates/annotate.pt

loggerhead/templates/atom.pt

loggerhead/templates/browse.pt

loggerhead/templates/changelog.pt

loggerhead/templates/collapse-all-button.pt

loggerhead/templates/collapse-button.pt

loggerhead/templates/inventory.pt

loggerhead/templates/macros.pt

loggerhead/templates/modified-file-link-log.pt

loggerhead/templates/modified-file-link-rev.pt

loggerhead/templates/revision.pt

loggerhead/templates/revisionfilechanges.pt

loggerhead/templates/revisioninfo.pt

loggerhead/tests/test_corners.py

loggerhead/tests/test_filechangecache.py

loggerhead/tests/test_simple.py

turbosimpletal

turbosimpletal/__init__.py

turbosimpletal/tests

turbosimpletal/tests/__init__.py

turbosimpletal/tests/simple.pt

turbosimpletal/tests/test_zpt.py

turbosimpletal/zptsupport.py

files modified:
MANIFEST.in

Makefile

NEWS

README.txt

dev.cfg

loggerhead.conf.example

loggerhead/TODO

loggerhead/__init__.py

loggerhead/branchview.py

loggerhead/changecache.py

loggerhead/config/app.cfg

loggerhead/controllers/__init__.py

loggerhead/controllers/annotate_ui.py

loggerhead/controllers/atom_ui.py

loggerhead/controllers/bundle_ui.py

loggerhead/controllers/changelog_ui.py

loggerhead/controllers/download_ui.py

loggerhead/controllers/inventory_ui.py

loggerhead/controllers/revision_ui.py

loggerhead/daemon.py

loggerhead/history.py

loggerhead/lockfile.py

loggerhead/lsprof.py

loggerhead/release.py

loggerhead/static/javascript/collapse.js

loggerhead/textindex.py

loggerhead/util.py

setup.py

start-loggerhead.py

Show diffs side-by-side

added added

removed removed

loggerhead/changecache.py

cached a change, it's good forever.

"""

import cPickle

import logging

import os

import shelve

import threading

import time

from loggerhead import util

from loggerhead.util import decorator

from loggerhead.lockfile import LockFile

with_lock = util.with_lock('_lock', 'ChangeCache')

SQLITE_INTERFACE = os.environ.get('SQLITE_INTERFACE', 'sqlite')

if SQLITE_INTERFACE == 'pysqlite2':

from pysqlite2 import dbapi2

_param_marker = '?'

elif SQLITE_INTERFACE == 'sqlite':

import sqlite as dbapi2

_param_marker = '%s'

else:

raise AssertionError("bad sqlite interface %r!?"%SQLITE_INTERFACE)

_select_stmt = ("select data from revisiondata where revid = ?"

).replace('?', _param_marker)

_insert_stmt = ("insert into revisiondata (revid, data) "

"values (?, ?)").replace('?', _param_marker)

_update_stmt = ("update revisiondata set data = ? where revid = ?"

).replace('?', _param_marker)

class FakeShelf(object):

def __init__(self, filename):

create_table = not os.path.exists(filename)

self.connection = dbapi2.connect(filename)

self.cursor = self.connection.cursor()

if create_table:

self._create_table()

def _create_table(self):

self.cursor.execute(

"create table RevisionData "

"(revid binary primary key, data binary)")

self.connection.commit()

def _serialize(self, obj):

r = dbapi2.Binary(cPickle.dumps(obj, protocol=2))

return r

def _unserialize(self, data):

return cPickle.loads(str(data))

def get(self, revid):

self.cursor.execute(_select_stmt, (revid,))

filechange = self.cursor.fetchone()

if filechange is None:

return None

else:

return self._unserialize(filechange[0])

def add(self, revid_obj_pairs, commit=True):

for (r, d) in revid_obj_pairs:

self.cursor.execute(_insert_stmt, (r, self._serialize(d)))

if commit:

self.connection.commit()

def update(self, revid_obj_pairs, commit=True):

for (r, d) in revid_obj_pairs:

self.cursor.execute(_update_stmt, (self._serialize(d), r))

if commit:

self.connection.commit()

def count(self):

self.cursor.execute(

"select count(*) from revisiondata")

return self.cursor.fetchone()[0]

def close(self, commit=False):

if commit:

self.connection.commit()

100

self.connection.close()

101

102

class ChangeCache (object):

103

104

def __init__(self, history, cache_path):

105

self.history = history

106

self.log = history.log

107

108

if not os.path.exists(cache_path):

109

os.mkdir(cache_path)

110

111

self._changes_filename = os.path.join(cache_path, 'changes.sql')

112

# keep a separate cache for the diffs, because they're very time-consuming to fetch.

self._changes_filename = os.path.join(cache_path, 'changes')

self._changes_diffs_filename = os.path.join(cache_path, 'changes-diffs')

113

# use a lockfile since the cache folder could be shared across different processes.

114

self._lock = LockFile(os.path.join(cache_path, 'lock'))

115

self._closed = False

116

117

## # this is fluff; don't slow down startup time with it.

118

## # but it is racy in tests :(

119

## def log_sizes():

120

## self.log.info('Using change cache %s; %d entries.' % (cache_path, self.size()))

121

## threading.Thread(target=log_sizes).start()

122

123

def _cache(self):

124

return FakeShelf(self._changes_filename)

125

# this is fluff; don't slow down startup time with it.

def log_sizes():

s1, s2 = self.sizes()

self.log.info('Using change cache %s; %d/%d entries.' % (cache_path, s1, s2))

threading.Thread(target=log_sizes).start()

126

@with_lock

127

def close(self):

128

self.log.debug('Closing cache file.')

129

self._closed = True

130

131

@with_lock

132

def closed(self):

133

return self._closed

135

@with_lock

136

def flush(self):

137

pass

138

139

@with_lock

140

def get_changes(self, revid_list):

def get_changes(self, revid_list, get_diffs=False):

141

"""

142

get a list of changes by their revision_ids. any changes missing

143

from the cache are fetched by calling L{History.get_change_uncached}

144

and inserted into the cache before returning.

145

"""

if get_diffs:

cache = shelve.open(self._changes_diffs_filename, 'c', protocol=2)

else:

cache = shelve.open(self._changes_filename, 'c', protocol=2)

146

out = []

147

missing_revids = []

148

missing_revid_indices = []

149

cache = self._cache()

fetch_list = []

sfetch_list = []

150

for revid in revid_list:

151

entry = cache.get(revid)

152

if entry is not None:

153

out.append(entry)

# if the revid is in unicode, use the utf-8 encoding as the key

srevid = util.to_utf8(revid)

if srevid in cache:

out.append(cache[srevid])

154

else:

155

missing_revids.append(revid)

156

missing_revid_indices.append(len(out))

100

#self.log.debug('Entry cache miss: %r' % (revid,))

157

101

out.append(None)

158

if missing_revids:

159

missing_entries = self.history.get_changes_uncached(missing_revids)

160

missing_entry_dict = {}

161

for entry in missing_entries:

162

missing_entry_dict[entry.revid] = entry

163

revid_entry_pairs = []

164

for i, revid in zip(missing_revid_indices, missing_revids):

165

out[i] = entry = missing_entry_dict.get(revid)

166

if entry is not None:

167

revid_entry_pairs.append((revid, entry))

168

cache.add(revid_entry_pairs)

169

return filter(None, out)

170

171

@with_lock

172

def full(self):

173

cache = self._cache()

174

last_revid = util.to_utf8(self.history.last_revid)

175

revision_history = self.history.get_revision_history()

176

return (cache.count() >= len(revision_history)

177

and cache.get(last_revid) is not None)

178

179

@with_lock

180

def size(self):

181

return self._cache().count()

182

102

fetch_list.append(revid)

103

sfetch_list.append(srevid)

104

105

if len(fetch_list) > 0:

106

# some revisions weren't in the cache; fetch them

107

changes = self.history.get_changes_uncached(fetch_list, get_diffs)

108

if changes is None:

109

return changes

110

for i in xrange(len(revid_list)):

111

if out[i] is None:

112

cache[sfetch_list.pop(0)] = out[i] = changes.pop(0)

113

114

cache.close()

115

return out

116

117

@with_lock

118

def full(self, get_diffs=False):

119

if get_diffs:

120

cache = shelve.open(self._changes_diffs_filename, 'c', protocol=2)

121

else:

122

cache = shelve.open(self._changes_filename, 'c', protocol=2)

123

try:

124

return (len(cache) >= len(self.history.get_revision_history())) and (util.to_utf8(self.history.last_revid) in cache)

125

finally:

126

cache.close()

127

128

@with_lock

129

def sizes(self):

130

cache = shelve.open(self._changes_filename, 'c', protocol=2)

131

s1 = len(cache)

132

cache.close()

133

cache = shelve.open(self._changes_diffs_filename, 'c', protocol=2)

134

s2 = len(cache)

135

cache.close()

136

return s1, s2

137

183

138

def check_rebuild(self, max_time=3600):

184

139

"""

185

140

check if we need to fill in any missing pieces of the cache. pull in

188

143

"""

189

144

if self.closed() or self.full():

190

145

return

191

146

192

147

self.log.info('Building revision cache...')

193

148

start_time = time.time()

194

149

last_update = time.time()

218

173

self.log.info('Revision cache rebuild completed.')

219

174

self.flush()

220

175

221

class FileChangeCache(object):

222

def __init__(self, history, cache_path):

223

self.history = history

224

225

if not os.path.exists(cache_path):

226

os.mkdir(cache_path)

227

228

self._changes_filename = os.path.join(cache_path, 'filechanges.sql')

229

230

# use a lockfile since the cache folder could be shared across

231

# different processes.

232

self._lock = LockFile(os.path.join(cache_path, 'filechange-lock'))

233

234

@with_lock

235

def get_file_changes(self, entries):

236

out = []

237

missing_entries = []

238

missing_entry_indices = []

239

cache = FakeShelf(self._changes_filename)

240

for entry in entries:

241

changes = cache.get(entry.revid)

242

if changes is not None:

243

out.append(changes)

244

else:

245

missing_entries.append(entry)

246

missing_entry_indices.append(len(out))

247

out.append(None)

248

if missing_entries:

249

missing_changes = self.history.get_file_changes_uncached(missing_entries)

250

revid_changes_pairs = []

251

for i, entry, changes in zip(

252

missing_entry_indices, missing_entries, missing_changes):

253

revid_changes_pairs.append((entry.revid, changes))

254

out[i] = changes

255

cache.add(revid_changes_pairs)

256

return out

176

Older »