Question 1

Legacy Code Archiveとは何ですか？

Accepted Answer

消えゆく90年代以前〜2000年代のソースコードを系統的に収集・保存するソフトウェア考古学プロジェクトです。Google Code Archive、CodePlex、SourceForge等の死蔵プラットフォームに眠るコードを、消える前に収集し、創造的な使い方を探ります。

Question 2

どのようなコードを収集していますか？

Accepted Answer

主にAI登場以前（Pre-AI時代）に書かれたソースコードが対象です。Google Code Archive（140万プロジェクト）、CodePlex Archive（10.8万リポジトリ）、SourceForge（約50万プロジェクト）、GitHub放棄リポジトリ、学術コード、政府公開OSS、レトロ/デモシーン（1980年代〜2000年代）などから収集しています。

Question 3

なぜ古いコードに価値があるのですか？

Accepted Answer

古いコードはAIの学習データに含まれない「ソフトウェアの骨董品」です。TODOコメントには開発者の苦悩が化石のように刻まれ、コードスメルのパターンは現代のソフトウェア品質向上に活かせます。また、パラダイムの変遷を20年分のコードで追うことは、ソフトウェア工学の自然史として学術的価値もあります。

Question 4

収集したコードはどのように活用されますか？

Accepted Answer

TODO Archaeology（コメントの化石記録分析）、Code Archaeology AI（コードの年代・起源推定）、Software Natural History（パラダイム変遷研究）、Before/Afterペアデータセット（リファクタリング前後の比較）、Code Sonification（コード構造の音楽化）、Legacy Whisperer（汚いコードを理解するAI訓練）など、研究・創作の両面で活用を構想しています。

Question 5

コードの提供や情報提供はできますか？

Accepted Answer

はい。古いコードベースの情報提供、共同研究のご提案、収集ソースの紹介など歓迎しています。お問い合わせフォームから「Legacy Code Archive（ソフトウェア骨董品収集）」を選択してご連絡ください。公開リポジトリで明示的なライセンスがあるコードのみを対象としています。

Question 6

Software Heritageなど既存の取り組みとの違いは？

Accepted Answer

Software Heritageは27B以上のソースファイルを保存する大規模アーカイブです。Legacy Code Archiveは保存だけでなく、古いコードの「創造的活用」に焦点を当てています。TODOコメントの考古学的分析やコードの音楽化など、骨董品を鑑賞し新しい価値を見出すアプローチが特徴です。

Question 7

レガシーコードの分析だけ依頼することはできますか？

Accepted Answer

はい。コードベース全体の移行ではなく、既存コードの構造分析・リスク評価・ドキュメント復元といった分析のみのご依頼も受け付けています。まず現状のコードを「読む」ことから始め、移行が必要かどうかの判断材料を提供します。

Question 8

COBOL・VB6・Fortranなど特定の言語にも対応していますか？

Accepted Answer

対応しています。Legacy Code Archiveの収集対象にはCOBOL（現在も世界で2,200億行が稼働）、VB6、Fortran、Perl、Delphi、Classic ASPなどが含まれます。言語の新旧を問わず、動いているコードには価値があるという立場です。

Question 9

レガシーシステムの移行にはどのくらいの期間がかかりますか？

Accepted Answer

規模と複雑さによります。数千行のスクリプトなら数週間、数十万行のエンタープライズシステムなら数ヶ月〜年単位です。重要なのは一括移行（Big Bang）ではなく、段階的移行（Strangler Fig Pattern）を検討すること。既存システムを動かしたまま、少しずつ置き換えるアプローチが現実的です。

Question 10

レガシーコード分析にはどんなツールを使いますか？

Accepted Answer

SonarQube（静的解析・コードスメル検出）、cloc（行数カウント・言語判定）、GitHub API（リポジトリメタデータ取得）、カスタムスクリプト（TODO/FIXME/HACKコメント抽出・感情分析）などを組み合わせて使用しています。ツールだけでなく、コードを実際に読んで文脈を理解する「人間の目」も重要です。

Question 11

小規模な調査から始められますか？

Accepted Answer

はい。「まずこのリポジトリだけ見てほしい」「このモジュールの構造を把握したい」といった小規模なご相談から対応しています。お問い合わせフォームからお気軽にご連絡ください。

Question 12

ドキュメントが一切ないコードでも対応できますか？

Accepted Answer

はい、むしろそれが本領です。Legacy Code Archiveの研究で培った考古学的アプローチにより、コメント・命名規則・コミット履歴・API使用パターンなどの痕跡からコードの意図と仕様を推定します。完全な復元は保証できませんが、「何もわからない」状態から「おおよその構造と意図がわかる」状態にすることが可能です。

Question 13

AIだけでレガシーコードを読み解くことはできないのですか？

Accepted Answer

コードの構文解析や関数の入出力説明はAIでも可能です。しかし「なぜこのif文がここにあるのか」「このマジックナンバーは何を意味するのか」といった業務文脈の推定は、AIだけでは精度が出ません。当社はAIによる大量解析と人間の業務知識・推論力を組み合わせるアプローチを取っています。

Question 14

レガシーコードの移行費用はどのくらいですか？

Accepted Answer

初期の構造分析（数十万円〜）から、大規模移行プロジェクト（数百万円〜）まで規模によります。まずは無料相談で現状をヒアリングし、分析の範囲と概算をご提示します。「まず分析だけ」という小規模なスタートも可能です。

Question 15

リモートでの対応は可能ですか？

Accepted Answer

はい。コードの受け渡し・分析・報告はすべてリモートで完結できます。Git リポジトリの共有、セキュアなファイル転送、オンラインミーティングでの報告が標準的な進め方です。大阪拠点ですが、全国どこからでもご相談いただけます。

LEGACY
CODE
ARCHIVE

WHAT IS THIS

INTERESTING NUMBERS

PUBLISHED WORKS

74,433件のTODOコメントを発掘したら、開発者の「叫び」が聞こえた