これは作成したソフトウェアのページで、ほとんどが研究で使用されています。
現在何に取り組んでいるソフトは、個人GitHubページで見ることができます。 コーディングが好きなので、タイムラインに緑のボックスがたくさんあると、それは通常、楽しんでいるということを意味します! また、研究室のGitHubページのものもチェックしてください。
最近のプロジェクト
2024年1月現在、私(および私の共同研究者)が取り組んでいるいくつかの最近のプロジェクトは次のとおりです:
- Zeno: 機械学習モデルを厳密に評価するための可視化ツール。
- prompt2model: 自然言語でタスクの説明を提供し、自動的にモデルをトレーニングするためのツール。
過去のプロジェクト
かなりの時間を費やした古いプロジェクトは(逆年代順に):
- ExplainaBoard: 機械学習モデルのための説明可能なリーダーボードのツールキット。
- compare-mt: テキスト生成システムの出力を比較するためのツールキット。
- DyNet: 自然言語処理など多くの分野で役立つ動的ニューラルネットワークのためのツールキット。
- lamtram: ニューラルネットワークを使用した言語モデルまたは翻訳モデルのためのツールキット。
- Travatar: 多くの並べ替えが必要な言語間で高い精度を達成できる、木から文字列への翻訳のためのツールキット。
- Lader: 機械翻訳における長距離並べ替えのためのツールキットであり、監視されていない識別パーサーとしても機能します。
- pialign: フレーズベースの機械翻訳のためのフレーズアライメントツールで、Mosesデコーダーと一緒に使用できます。
- latticelm: ベイジアン・ピットマン・ヨール言語モデルを使用した教師なし単語セグメンテーションのためのツール。
- KyTea: 日本語や中国語など、単語セグメンテーションが必要な言語のテキスト分析のためのツールキット。
- Kyfd: テキスト処理のための加重有限状態トランスデューサーモデルをデコードするためのツールキット。
- Kylm: Javaで完全に書かれたシンプルな言語モデリングツールキットで、スムージング方法を備えたn-gram言語モデルを実装しています。
その他のプログラムとスクリプト
これらは真剣なプロジェクトではありませんでしたが、後世に残すために保管しておきます。
- tmert.py: 質問応答システムのための閾値最小エラー率トレーニングのプログラム。
- prontron: 構造化パーセプトロンを使用して(主に日本語で)発音推定を行うプログラム。
- dirichlet-topic.pl: ディリクレ過程に基づくモデルを使用して、特定のトピックの代表的な単語を見つけるためのシンプルなスクリプト。