PHASE: COLLECTION

LEGACY
CODE
ARCHIVE

古いコードは骨董品。絡まった歴史が、今ようやく面白くなる。

Software Antiques Collection — Where tangled history finally gets interesting.

SCROLL
// TODO: fix this before release (2003-04-12) · /* HACK: temporary workaround for IE6 */ · # FIXME: this will break in Y2K · REM KLUDGE: don't ask why this works · ; WORKAROUND: compiler bug in Turbo Pascal 5.0 · // TODO: remove before shipping (1997-08-23) · /* XXX: whoever wrote this, I'm sorry */ · // TODO: fix this before release (2003-04-12) · /* HACK: temporary workaround for IE6 */ · # FIXME: this will break in Y2K · REM KLUDGE: don't ask why this works · ; WORKAROUND: compiler bug in Turbo Pascal 5.0 · // TODO: remove before shipping (1997-08-23) · /* XXX: whoever wrote this, I'm sorry */ · // TODO: fix this before release (2003-04-12) · /* HACK: temporary workaround for IE6 */ · # FIXME: this will break in Y2K · REM KLUDGE: don't ask why this works · ; WORKAROUND: compiler bug in Turbo Pascal 5.0 · // TODO: remove before shipping (1997-08-23) · /* XXX: whoever wrote this, I'm sorry */ ·
01

WHAT IS THIS

90 年代以前のソースコードは、AI が登場するはるか前に書かれた ソフトウェアの骨董品

誰かが手作業で打ち込み、動かし、放置し、忘れられたもの。 死蔵プラットフォームに眠るそれらを、消える前に収集し、 創造的な使い方を探る。

“Clean OSS is edited literature. Legacy code is field recordings.”

まず集める

消える前に、静かに

面白い使い方を探す

創造的に、制約なく

答えはあとから

読み解く時間そのものが価値

02

INTERESTING NUMBERS

27B

unique source files

Software Heritage

220B

lines of COBOL

still in production

30-50%

industrial dead code

nobody understands

50%+

OSS projects die

within first 4 years

6.6yr

code half-life

Linux Kernel

4mo

code half-life

Angular (20x shorter)

3x

more predictable

code vs English

03

COLLECTION SOURCES

AGoogle Code Archive1.4M projects2006 - 2015PRIORITY
ACodePlex Archive108K repos2006 - 2017ARCHIVED
ASourceForge~500K projects1999 - presentACTIVE
BGitHub AbandonedMillions2008 - presentFILTERING
CAcademic Code∞ (74% broken)VariousRICH SPAGHETTI
DGovernment OSS17K+VariousPUBLIC DOMAIN
ERetro / DemosceneCultural heritage1980s - 2000sHISTORICAL
04

WHAT WE MIGHT DO

まだ決めなくていい。集めてから見えてくるものがある。

01

TODO Archaeology

コメントに刻まれた開発者の苦悩の化石記録。誰もやっていない。

NOVELTY 10/10LOW COST
02

Code Archaeology AI

不明なコード片の年代・起源・文脈を推定する骨董鑑定士。

NOVELTY 10/10
03

Software Natural History

パラダイムの興亡を 20 年分のコードで追う。進化の自然史。

ACADEMIC
04

Before / After Pairs

スパゲッティ→きれいの対訳コーパス。眺めるだけで面白い。

FEASIBILITY 9/10
05

Code Sonification

古いコードのリズムや構造を音楽に変換。レガシーの「音」を聴く。

CREATIVE
06

Legacy Whisperer

きれいなコードしか知らない AI に汚いコードを食わせたら?

HIGH IMPACT

☙ FOUND IN: payroll_calc.c — last modified 2003-04-12

// ============================================
// FIXME: this workaround has been here since 1998
// Original author: unknown (left company in 2001)
// Last modified: 2003-04-12
// Nobody knows why removing this breaks payroll
// ============================================
if (month == 2 && day > 28) {
    day = 28; // TODO: handle leap years properly
    // HACK: just... don't deploy in February
}
// See you space cowboy...
05

COLLECTION PIPELINE

01

DISCOVER

API / Archive index

02

CLONE

--depth 1

03

EXTRACT

Metadata + cloc

04

SCAN

Smells + Secrets

05

STORE

Parquet + Raw

GET IN TOUCH

興味を持ったら、話しましょう。

レガシーコードの収集・活用・共同研究など、このプロジェクトに関するご相談はお気軽にどうぞ。

CONTACT US

LEGACY CODE ARCHIVE

骨董品屋の主人は説明しない。

「これ、いいでしょう」と言うだけ。