Gemma 4
ちょっと前に話題になってた。スマホでも動かせるってやつ
ローカルLLMはやったことないからやってみたい!
Geminiに聞いたらLM Studio使うといいって。LM Studio自体は別にGoogleのではないっぽいけど、
公式でも言及ある
LM Studioダウンロードしたら、gemma-4-e4bがおすすめされるのでおとなしくそれを入れた

強強PCで動くモデルとそうじゃないモデルがあるらしい
そして早速チャットをしてみる。

こんにちはと書いたら、それに対する回答を考えている過程を見せてくれる。5秒ぐらい考えてた

画像Upもできて、読み取りとかはできた。作成はできないらしい

ClaudeCodeでもこのモデルを動かせるらしいから、API契約してなくてもローカルで簡単なファイル操作ぐらいならできるのでは?
Qwen
ちょっと前に見たQwenもローカルっぽい
面白そう
Qwen3のTTS・ボイスクローンを試してみたけど、引くくらい自分の声だ…
— あんどう@AI開発者 (@t_andou) 2026年1月23日
MacBookのマイクで10秒程度の参照音声を録音して、それを元にテキストを発話させてみた
一昔前は大量に文章を読んでそれをGPUで数時間学習する必要があったけど、今はそれも必要無いのか pic.twitter.com/JKVqgMAaJB
ずっと音声専用の何かかと思ってたので、その後も色々な用途で出てきてへ〜っておもった
静止画のカメラアングル変えられるやつすごいね。
— null-sensei (@GOROman) 2026年1月8日
Qwen Image Edit 2511 — 3D Camera Controlhttps://t.co/W2IxzWNRHC pic.twitter.com/N43pG4zbkd
やっぱQwen3.6-35B-A3Bすごいぞ。
— きしだൠ(K1S) (@kis) 2026年4月21日
Box2Dつかえって言ったけど、独自実装でやった。ぜったいうまく動かんだろうって思ったけど、ちゃんと動いてる! pic.twitter.com/am1R9wjCaz
でもGemmaよりは強いPC向けなのかな〜
一応軽いのもあるみたい。
3050Ti、グラボ4GBだと厳しそう
https://www.reddit.com/r/LocalLLaMA/comments/1sodmkp/imposing_my_laptop_to_run_qwen_36/?tl=ja
音声AI
音声系のAIといえば、スーツさんの動画が一部AI音声らしいのだが、全然わからない。
まじで違和感ない。これどのAI使ってるんだ?
どれ使ってるかはわからないけど、なんか試してみたいからGeminiに聞いて出てきたElevenLabsというのを試す
色々機能があってその中のAIボイスクローン
この最初のページで自分の声を録音してもそれは使われない・・・

ログインさせられて、課金ページへ

でもここでスキップして

そのまままた別の録音ページに行ってまた音声録音するとこの画面になり、ここの声をプレビューで、自分の声で別のセリフを喋るのが聞こえる!なかなかすごい!

まあまた保存するのに課金必要って画面出てくるけど