# 散らかった文書が、コマンド1つで構造化された知識に変わる。
Canonical: https://social-archive.org/yena/kG2rkMXLZB
Original URL: https://x.com/so_ainsight/status/2070374000266785083
Author: そう｜Claude Codeで始めるAI自動化
Platform: x
## Content
## 1 散らかった文書が、コマンド1つで構造化された知識に変わる。 AIに文書を読み込ませるとき、地味にきついのが「検索してもほしい情報が返ってこない」問題。 多くのAI文書ツールは、ドキュメントをバラバラに分割して検索にかけるだけ。精度が上がるかどうかは運次第。 そこで出てきたのが Hyper-Extract。 非構造化テキストを構造化された知識ベースに変換する、Apache 2.0のOSSツール。 ただのPDF分割ツールではない。 検索精度を上げるためだけのラッパーでもない。 Hyper-Extractは、テキストを事前に整理して、AIがナレッジグラフ・時系列データ・空間情報をすぐ引けるようにする。 変換できる知識構造が8種類ある。 → ナレッジグラフ（정보 간의 연결을 그래프로 시각화） → ハイパーグラフ（복잡한 다대다 관계를 구조화） → 時間グラフ（시계열 변화 추적） → 空間グラフ（장소·위치 관계 정보 정리） → 時空間グラフ（시간과 장소의 양축으로 구조화） → 型定義データモデル（구조화된 데이터로 출력） → Obsidian Vault（wikilinks 형식의 Markdown 노트 그룹으로 변환） → MCPナレッジベース（Claude나 IDE에서 직접 쿼리 가능） これまで「文書を何度も検索して目的の情報を探す」作業を、「一度変換すれば繰り返し高精度で参照できる知識ベース」に変えられる。 特に論文整理、決算資料の構造化、プライベート文書のナレッジ管理では、体感がかなり変わるはず。 数字でも確認できる。 → 80以上のYAMLテンプレート（金融・法律・医療・産業・一般向け） → GraphRAGやLightRAGなど10以上の抽出アルゴリズムを搭載 → OpenAI・Claude両対応、vLLMでローカル実行も可能 → コードなしでYAMLテンプレートから即スタート 導入もシンプル。 uv tool install hyperextract ・無料（Apache 2.0、商用利用可） ・vLLMを使えばローカルだけで完結（外部APIに依存しない構成も可能） ・MCPでClaudeやIDEから直接参照できる GitHub 2,400スター超えも納得。 公式リポジトリは下に置きます。 {{IMAGE_0}} --- ## 2 公式リポジトリはこちら https://t.co/QLyUlCAb7q