Phi モデルをローカルで検証できるサンプルアプリ

はじめに
推奨環境
目的
特長
モデルのダウンロード

はじめに

Phi モデルをローカルで検証できるサンプルアプリを作成しました。
github.com

ライブラリは ONNX です
C# で書かれています

推奨環境

最低 RAM 16GB 以上
推奨 RAM 32GB 以上

目的

Phi3, Phi3.5 をローカル CPU で動かす検証の用途
Phi3, Phi3.5 でエッジ AI アプリを作る前に Phi3, Phi3.5 で求めている精度が出るか確認できる
Phi3, Phi3.5 でエッジ AI とりあえず遊んでみる

特長

設定ファイルは json

以下の項目を設定できます

ローカルに保存したモデルの Path
翻訳の ON/OFF
RAG の ON/OFF

プロンプトを一度英語に翻訳して問い合わせ、結果を再度日本語にできる

Phi シリーズは英語に最適化されているため、プロンプトを一度英語にして問い合わせ結果を再度日本語にすることで精度を高められます。翻訳の ON/OFF は設定ファイルのオプションで指定します。
　

RAG に対応

md, txt で付加情報を与えることで RAG に対応しています。特に翻訳した時の固有名詞を与えることで、精度を高められます。

ベクトル検索は Build5Nines 氏の SharpVector
を使用しています。
github.com
　

処理フロー

システムプロンプトを英語に翻訳する
ユーザープロンプトを英語に翻訳する
英語にしたプロンプトで問い合わせ
レスポンスでベクトルデータベースに問合せし、RAG のデータ取得
RAG のデータを付加して日本語に翻訳

設定ファイルのフォーマット

settings.json

{
  "modelPhi35Min128k": "<Your model path>",
  "modelPhi3Med4k": "<Your model path>",
  "modelPhi3Med128k": "<Your model path>",
  "modelPhi3Min4k": "<Your model path>",
  "modelPhi3Min128k": "<Your model path>",
  "modelPhi4Unofficial": "<Your model path>",
  "isTranslate": "<true or false>",
  "isUsingRag": "<true or false>",
  "systemPrompt": "<Your system prompt>",
  "userPrompt": "<Your user prompt>",
  "additionalDocumentsPath": "<Your documents path>" // RAG 用ファイルの Path
}

モデルのダウンロード

Hugging Face からダウンロードします。
huggingface.co

ダウンロードするコマンドについてはアプリに付属の download_model_cmd.txt を参考にしてください
　

個人的なメモ

Tomohiro Suzuki ＠hiro128_777 のブログです。Microsoft MVP for Developer Technologies 2017- 本ブログと所属組織の公式見解は関係ございません。