Pgit: Linux Kernel을 PostgreSQL로 가져왔습니다
(oseifert.ch)
pgit은 Git 히스토리를 PostgreSQL 데이터베이스로 변환하여 SQL로 쿼리할 수 있게 해주는 혁신적인 도구입니다. 작성자는 리눅스 커널의 20년 치 방대한 커밋 내역(142만 개)을 단 2시간 만에 성공적으로 임포트하며, 코드 히스토리를 구조화된 데이터로 다룰 수 있는 가능성을 입증했습니다.
이 글의 핵심 포인트
- 1리눅스 커널의 20년 치 히스토리(142만 개 커밋)를 PostgreSQL로 임포트 성공
- 2pg-xpatch 기술을 통한 효율적인 델타 압축으로 2.7GB 규모의 데이터 관리
- 3Git 히스토리를 SQL 쿼리로 분석 가능한 구조로 변환