従来技術との差異
Difference
従来技術の内容
◆ 辞書技術
・ 形態素辞書
・ 係り受け/共起辞書
・ 意味概念体系辞書
・ シソーラス辞書
・ 知識ベース辞書
・ 同義語/類義語/関連語辞書
◇ 膨大な人件費と時間をかけて人手で作成
◇ 膨大な辞書のためメモリやディスク容量も膨大
◇ 膨大な辞書のため検索や処理時間も遅い
◇ 膨大な辞書のためメンテナンスに時間がかかる
◆ 統計的(確率モデル)技術
・ 形態素データ(分ち書き、品詞付け)
・ 構文解析データ(文節統合、係り受け)
・ 同義語/類義語/関連語データ
・ シソーラス/知識データ
◇ 訂正や新語登録に時間がかかる(コーパスからバッチ処理)
◇ 頻度情報が主な要素なため精度が難点
◇ ベクトル処理のため閾値が曖昧
◇ 文脈解析である照応解析や文間関係が曖昧
◇ 意味解析である意味概念体系(シソーラス、知識)が曖昧
◇ 深層格情報が採集できない

