
Sudachi
ビジネス向け日本語形態素解析器 - Elasticsearch対応
無料無料・オープンソース(Apache 2.0)
プロダクト詳細
Sudachi とは
Works Applications が開発した、ビジネス用途に最適化された日本語形態素解析器です。
主な機能
- 3段階の分割モード: A(短い)/ B(中間)/ C(長い)
- 複数辞書エディション: small / core / full
- 正規化機能: 異体字・送り仮名の統一
- Elasticsearch プラグイン: 全文検索に統合
- Python版 SudachiPy: Python環境で利用可能
特徴
- UniDic + NEologd を元にした大規模辞書
- 新語・固有名詞に強い
- 商用利用可能
対象ユーザー
- 自然言語処理エンジニア
- 検索システム開発者
- テキストマイニング
