トマシープが学ぶ

Unity/VR/AR/デザイン好きのミーハー 記事内容は自分用のメモです

ローカルLLM Gemma 4など

Gemma 4

ちょっと前に話題になってた。スマホでも動かせるってやつ

ローカルLLMはやったことないからやってみたい!

ai.google.dev

Geminiに聞いたらLM Studio使うといいって。LM Studio自体は別にGoogleのではないっぽいけど、

lmstudio.ai

公式でも言及ある

ai.google.dev

LM Studioダウンロードしたら、gemma-4-e4bがおすすめされるのでおとなしくそれを入れた

強強PCで動くモデルとそうじゃないモデルがあるらしい

そして早速チャットをしてみる。

こんにちはと書いたら、それに対する回答を考えている過程を見せてくれる。5秒ぐらい考えてた


画像Upもできて、読み取りとかはできた。作成はできないらしい

ClaudeCodeでもこのモデルを動かせるらしいから、API契約してなくてもローカルで簡単なファイル操作ぐらいならできるのでは?

note.com

Qwen

ちょっと前に見たQwenもローカルっぽい

面白そう

nowokay.hatenablog.com

github.com

ずっと音声専用の何かかと思ってたので、その後も色々な用途で出てきてへ〜っておもった

 

でもGemmaよりは強いPC向けなのかな〜

一応軽いのもあるみたい。

lp.yoom.fun

3050Ti、グラボ4GBだと厳しそう

https://www.reddit.com/r/LocalLLaMA/comments/1sodmkp/imposing_my_laptop_to_run_qwen_36/?tl=ja

 

音声AI

音声系のAIといえば、スーツさんの動画が一部AI音声らしいのだが、全然わからない。

まじで違和感ない。これどのAI使ってるんだ?

www.youtube.com

どれ使ってるかはわからないけど、なんか試してみたいからGeminiに聞いて出てきたElevenLabsというのを試す

色々機能があってその中のAIボイスクローン

elevenlabs.io

この最初のページで自分の声を録音してもそれは使われない・・・

ログインさせられて、課金ページへ

でもここでスキップして

そのまままた別の録音ページに行ってまた音声録音するとこの画面になり、ここの声をプレビューで、自分の声で別のセリフを喋るのが聞こえる!なかなかすごい!

まあまた保存するのに課金必要って画面出てくるけど