トマシープが学ぶ

Unity/VR/AR/デザイン好きのミーハー 記事内容は自分用のメモです

Runway-Gen2とMusic GenとBard

Runway Gen2

昔触った映像生成ができるAIのRunwayがすごくなったらしい

bibinbaleo.hatenablog.com

以前触った時は、自分でUpした動画をプロンプトで別のスタイルにしてくれるという機能しかなかった。

今回はテキストから動画を作れる。G2を押す

テキストを入れるとまずは4つの画像ができる。そこから一つを選んだら動画が作成される

4秒の動画ができた。食べてないやん!!でも動画作れるの面白い~

 

Runwayのすごいのは無料で少しは触れるってとこだと思う

これすごい。

MusicGen

音楽生成も興味ある。BGMとか探すのめんどくさいから生成したいもん。

でもまだ音楽系はクオリティが低いといわれていたけど、MusicGenはいいらしい

huggingface.co

上のサイトでプロンプトを入力する。ログインなしで使えた!

1分ぐらいで15秒の曲が生成された~

A high-tempo piano piece like the opening of an RPG game

soundcloud.com

15秒に収まってない感じはするが、まあまあかな?微妙だけど

mp4形式でダウンロードできるけど、Twitterにはなぜか投稿できなかった。縦横比が横長すぎるせいかなSoundCloudには投稿できた。

 

Bard

画像認識してくれるようになったらしい。

forest.watch.impress.co.jp

でも英語版でしか使えない。

どうやって英語版にするのかわからない;;

聞いて出てきた答えもあってないし

Chromeを英語にするのではなく、Googleの自分のアカウントのアイコンから言語を英語に設定したらできた

Englishを選んだ後に出てくる選択肢がよくわからなくて、なんで保存が押せないんだって思っちゃった。英語圏の国か

この画像を入れた

意外といい感じのプランが出たかも

ちゃんと日本語理解している

Googleレンズが使われている