Scrivener 내부 RTF 파서 작성 후 15년, rtfstruct를 만든 이유
(dev.to)
AI 문서 파이프라인의 데이터 구조 손실을 방지하고자 RTF의 구조적 맥락을 보존하며 AST를 생성하는 'rtfstruct' 라이브러리를 공개함으로써, RAG 시스템의 신뢰도를 높이고 AI 모델의 정확한 문맥 이해를 돕는 기술적 해법을 제시합니다.
이 글의 핵심 포인트
- 1기존 AI 파이프라인은 RTF를 텍스트로 변환하며 표, 목록, 각주 등 핵심 구조를 손실시키는 고질적 문제를 가짐
- 2rtfstruct는 RTF를 중립적인 AST(추상 구문 트리)로 변환하여 문서의 구조적 의미를 보존함
- 3