
GiNZA
spaCyベースの日本語自然言語処理ライブラリ
無料無料・オープンソース(MIT License)
プロダクト詳細
GiNZA とは
Megagon Labs と国立国語研究所が共同開発した、spaCyベースの日本語自然言語処 理ライブラリです。
主な機能
- 形態素解析: SudachiPy による高精度なトークン化
- 固有表現抽出: 人名・地名・組織名などの抽出
- 係り受け解析: Universal Dependencies 準拠
- Transformers対応: BERT等の事前学習モデル利用可能
- spaCy互換: spaCyのエコシステムをそのまま活用
活用例
- テキストマイニング・感情分析
- チャットボット・FAQ検索
- 文書分類・要約
- 情報抽出・知識グラフ構築
技術スタック
Python / spaCy / SudachiPy / Transformers
