2024年12月30日月曜日

2024年12月27日金曜日

生成AIとの向き合い方

前回からの続き。


生成AIには既存の人間が作った学習ソースが必要である。  

その学習の過程が著作権を侵犯しているのではないかという疑いから、多数のアーティストが抗議の声を上げ、新聞社や音楽レーベルなどがOpenAIやsunoAIを起訴している。  

また、生成AIで作られたCMが炎上したりしているという現状も知っている。

つまり現在の社会において、生成AIを使用することやその成果物に対してコンセンサスが定まっていない。


ここで僕、木城ゆきとが生成AIに対してどんなスタンスを取っているかを明確にしておきたい。  

ここからはセンシティブな問題に触れるので、人によっては不愉快に感じる方もいるかもしれない。

あくまで僕個人の考えをのべるが、異なる立場の方々の考えを否定したいわけではない。

気分を害する人がいたら先に謝っておく。



僕は生成AIはツールに過ぎないと思っている。  

もともと技法マニアなので、何か新しい技法、新しい画材、新しいツールが出たと聞けば試さずにいられない。

リキテックスにエアブラシから、MacとPhotoshopに変えてきた。

もちろんアナログな画材にも良さはある。

しかし自分は「ワイヤーフレームのCGを描くのにホワイトとトーンで手書きするのはバカらしい」と感じるたちだ。

劇中のCGはコンピューターに描かせたい。そして昔は夢物語だったことが今はソフトとハードの進歩によって可能になった。

生成AIの発達には、僕は恐れや不快感よりも、好奇心やワクワクが上回っている。

問題はこのじゃじゃ馬なテクノロジーを、どうやって自分の仕事のスタイルに落とし込むか。そのことをずっと考えている。

もし同じように生成AIを使っている人がいれば、意見や体験談を教えてほしい。お互いに情報をシェアしながら、面白い使い道を模索していけたら嬉しい。


著作権侵害に関しても問題は多々あるが、そういった社会的議論は進行形なので、今はそれよりも技術的な可能性を試したいと思う。


今後もテクノロジーの進歩に合わせて試行錯誤を続け、作品に生かしていきたい。生成AIがもたらす創作の可能性を、個人的にはとても楽しみにしている。


 

2024年12月26日木曜日

ミュージックビデオシリーズ「世界怪奇ツアー」を作る

 前回からの続き。

音楽をYouTubeに公開するにあたり、画像を用意しなければならない。  

ここで初めて、前の年からいじっていた画像生成AIが実用の日の目を見ることになった。


初期のムービーの構成はシンプルで、簡単なループアニメーションとサビの止め絵でできている。  

各ムービーでどんな生成AIサービスを使っているかはムービー末尾のテロップに表記している。  

初期のころ、よく使っていた生成AIアニメのサービスはKaiberで、静止イラストがわしゃわしゃと動くような感じ。  

静止画の生成AIはAdobe FireflyとDreamStudioというウェブサービスを使用していた。  


Fireflyは少し癖があり、ものすごい解像度の高い写真クオリティの絵が得意な反面、イラスト調の絵のクオリティは残念無念という感じだった。  

DreamStudioの内部はおそらくStable Diffusion XL。ネガティブプロンプトが使えたり、読み込んだ画像を生成AIで再解釈してくれたりと結構便利だったが、Stable Diffusion3の発表と同時に突然サービスがなくなってしまった。


この世界の進歩は早く、OpenAIがすさまじいクオリティの動画生成AI「Sora」のデモを発表し、それがリリースされる前に次々に新しい動画生成AIサービスが他社から出てきた。  

もはやKaiberの時代遅れ感はいかんともしがたいので解約し、Lama Dream MachineとRunway Gen 3のサブスクリプションに入った。


静止画のサービスはDreamStudioが使えなくなってしまったので、しばらくDALL-E3を使いながら(ChatGPTのサブスクに入っているので使える)、他のサービスを探していた。  

Midjourneyのウェブアプリ版が登場し、このサブスクに入ることにした。以前からMidjourneyの性能の評判は聞いていたが、Discordのアカウントから操作するのが嫌で使わなかったのだ。  


Midjourneyは評判に違わず、すごい美麗なイラストレーションや写真調の画像が作れて、インターフェースもわかりやすいので大変満足している。「コティングリーの妖精」以降、多用している。

DALL-E3は癖のある独特の画調のイラストができるが、長所はプロンプトの追従性が極めて高いこと。他の生成AIでは命令通りの絵が出ない時に頼りになる。「テケテケ」のサムネ画像もDALL-E3で出した画像にレタッチで手を加えたものだ。

Midjourneyの作業画面。一回のプロンプト入力で四つの画像が生成される。

動画生成AI、Lama Dream Machineのトップ画面。最近のアップデートでお上品になってしまった。
クマ男が爆発をバックに歩いてくる、以前のB級映画っぽいデモが好きだったんだが。

Lama Dream Machineの作業画面。現在はこのサービスをメインに動画を作っている。
ちょっと前にOpenAIのSoraが正式公開されたが、期待されたほどの性能ではなく、
ちゃんと使うには月3万円もお金がかかるので、今はムリ。

FinalCutProで動画編集する。
解説パートで流れるBGMもsunoAIでつくったもの。
ナレーションは無料の合成音声ソフトVOICEVOXを使用。
最近になり、より自然な合成音声が作れるAivisSpeechなどがリリースされたが、
まだ落ち着いたナレーションに適した声がない。今後に期待。


現在(2024年12月)までに70本以上のMVを作ってYouTubeで発表した。  

この制作過程で、生成AIの現在における限界も痛感した。    

今の生成AIでは次のような題材は作るのが難しい。

※ちなみに、世間で流行っているアニメ美少女のような題材はまったく作らないので、そっち方面の難しさはわかりません。※


・日本の風景

  生成AIの学習ソースは欧米のものに偏っているため、日本で当たり前に見ることができる風景を作るのが苦手。  

  例えば、ランプが横に並ぶ信号機など。欧米式にランプが縦に並んだものが出てくる。畳や障子などもそれっぽい絵は出るが、細部はかなりおかしくなる。  

・一本足、一つ目など、本来対になっているものが無いもの

  学習ソースの偏りか、制限がかかっているのかは不明。  

・体の一部が欠損しているもの

  おそらく規制の関係で作ることができない。「首なしライダー」などはレタッチで首を消した。  

・軍艦、戦闘機などの機械の正確な描写

  特にレシプロ戦闘機を描くのが苦手のようだ。「フィラデルフィア実験」「マンテル大尉に花束を」では苦労した。  

  「南極のニンゲン」の捕鯨船は実際にはまったく形が違うが、イメージということで妥協した。  

・乱雑な状態

  「バルバドスの動く棺桶」で石室内に乱雑に積まれた棺桶を描かせようと何度も試したがダメだった。  

・看板などの文字

デタラメな文字が出てくる。「時空のおっさん」ではむしろ異世界らしさが増した。最近の生成AIではちゃんと文字を出せるようになってきているらしい。

・ステレオタイプ(偏見)にひきずられる

例えば日本の風景を出そうとすると、「富士山」「満開の桜」「五重塔」などが何の脈絡もなく出てくる。「デボンジャーの悪魔」では下半身がヤギのひづめを持つ、典型的な中世の悪魔のイメージを出そうとしたが、Midjourneyではなぜか筋骨隆々のモンスターしかでなくて、Dall-E3でなんとか作った。Midjourneyは最近のゲームのコンセプトアートの学習によるバイアスがかかっているっぽい。

・奇怪な姿をしたモンスター

  「世界怪奇ツアー」では現実にあった事件を題材にしているため、目撃者証言やスケッチに基づいたUMAや宇宙人を出したいのだが、プロンプトだけではうまく作れたためしがない。  

  ツチノコならなんとかなるだろうと楽観していたのだが、これすらもうまくいかなかった。  

  こういう場合は僕が自分で手描きでイラストを描いている。  

・流血などのゴア描写

  ウェブサービスでは当然のように規制されている。ローカルでStable Diffusionを使えば作れるかもしれないが、おそらく発表の段階でYouTubeの規約に引っかかってしまうだろう。  

  こうした理由から、曲を作ったもののMV化できない曲が三曲ほど存在している。

楽曲だけを音楽配信サービスで流すことも計画しているので、そのうちこれら未発表曲も日の目を見るかもしれない。


次回に続く。

2024年12月25日水曜日

sunoAIで音楽を作り始める

 前回からの続き。


2024年3月、sunoAIという音楽作成生成AIを知る。

www.suno.com/

以前どこかで書いたかもしれないが、僕は音楽が大好き。主に80年代。

楽器も音譜も読めないくせに、過去何度も音楽制作に乗り出しては挫折する、ということを繰り返してきた。  

弾けもしないキーボードを買ったり、何万円もする音源を買ったり、実に無駄な投資をしてきた。(泣)  

今までもAIで自動作曲するというサービスをいくつも試したが、到底満足できるものはなかった。


ところが、sunoAIは違った。ちょっと試しただけで、なんかかっこいい曲ができる!

なんだと!?すごい自然だ!  

ビャビャァッ!と電撃が走った!  

「これは…もしかすると、長年の夢がかなうかもしれない!?」  

以前音楽制作を学んでいた時に見ていたYouTuberの似顔絵村の村長さんことHIRONOBU NAKAKUBOさんがChatGPTで歌詞を作り、それを使いsunoAIで歌を作るプロセスを公開していたので、それに習ってやってみた。

似顔絵村の村長-YouTube


僕は音楽は作れないが、アイディアならたくさんある。  

大昔、まだ銃夢の連載を始める前、80年代メタルが熱かったころ。  

70年代の古いアニメや特撮の主題歌の良さを「再発見」し、CD集を買い集めた。  

また同じころ、柴田錬三郎や山田風太郎の時代剣豪小説を「再発見」し、読みあさった。  

これらからインスピレーションを受け、古いアニメや特撮主題歌をメタルで演奏したら面白いとか(のちに90年代半ばにアニメタルが実現)、和楽器を使ってメタルを演奏したら熱いとか(のちに90年代に六三四や陰陽座が実践)、仲間内で話していた。  

そうした古いアイディアの中に、僕の好きなオカルト題材とメタルの融合があった。  

(メタルではないが筋肉少女帯に何曲かオカルト題材の曲がある。オーケンは僕と同年代で有名なオカルトマニア。)

ChatGPTへの指示。

ここでは各パートの構成、サビのフレーズの指示をしている。

ChatGPTの出力。
そのままでは納得いかないことが多いので、Notionにコピペして、
構成を生かしつつ手書きで直していく。

sunoAIのトップページ。

僕のアカウントのライブラリ。

歌詞をひらがなで打ってあるのは、読み間違えを防ぐテクニックの一つ。



今こそ長年の夢を実現させるときだ。  

試しにモスマンを題材にsunoAIでテスト曲を作ってみた。  

「オオ…なんかかっこいい曲ができるぞ!」  

有料サブスクリプションに入り、たちまち何曲も作った。  

この歳になると、ワクワクで胸が高鳴るなんてことはめったになくなるのだが、この時は  

「次はどんな曲ができるんだ…!?」と興奮がすごかった。


10曲ほどのストックができた時点で、これを他の人にも聞かせたくなった。  

世間に発表する手っ取り早い方法はYouTubeである。

次回に続く。

2024年12月24日火曜日

生成AIとの付き合い始め

 前回からの続き。

2022年夏にMidjourney、Stable Diffusionが、11月にChatGPTが公開され、興味深くウェブ記事をチェックしていたものの、まだ敷居が高く感じて手は出さなかった。


2023年の夏頃から、AIピカソなどのスマホアプリで、パグの画像を作って遊び始めた。  

本格的に使ってみたくなり、手元にあったWindowsノートPC(モバイルRTX3060、ビデオメモリ6GB)に苦労してStable Diffusionの実行環境を構築した。  

これで事実上無限に画像を生成できるわけだが、使ってみるとすぐにその限界も分かった。  

まず、作れる画像の解像度が低すぎて、漫画にそのまま使うのは難しい。  

(当時。現在は高解像度化もかなり可能になってきている。もちろんビデオメモリの大きさに制限される。)  

シームレスパターンが作れるので、これは実際に漫画の中にも一部使用している。  

とにかく、パグのジョーク画像を作って身内で楽しむのがせいぜいで、あまり実用的な使い方が思い浮かばなかった。

パグガメ

パグカッチ

パグヒーロー

パグツムリ

パグトパス

2024年2月、ChatGPTの有料サブスクリプションに加入した(ChatGPT Plusプラン)。  

しかしその時点では有効な使い方がまるで浮かばず、試しに「地球と火星の最接近の年を数百年先まで計算させる」というお題でやらせてみたものの、あまり精度が高くない答えが出て、使い物にならなかった(この時点でのChatGPT 3.5は数学が苦手だった。現在のChatGPT 4.0は数学能力がかなり高くなっている)。


次回に続く。

2024年12月23日月曜日

ChatGPTとブレインストーミング

 ここ一週間ほど、銃夢の来年からの構想についてChatGPTとブレストしている。  

世界設定を教えた上で、短編のアイディアを300ほど出してもらった。  

もちろんそのまま漫画が描ける完成度のものはないが、自分では考えていなかった角度からの設定などもあり、面白そうな短編のプロットが九つほどできた。  

一人でウンウン考えていても、一週間で九つの短編プロットを作るのは難しいので、これは大きな省力化だ。


実際にChatGPTとのやりとりのキャプチャが以下。

世界観の設定をChatGPTに教えているところ。

条件を示して、10のアイディアを出すように指示しているところ。



もう一つ、ChatGPTの有効な使い道として、アプリのヘルプとして使うのが非常に役に立つことを発見した。  

たとえば、ClipStudioPaintで絵を描いていて、パレットを動かしたいのに固定されていて動かない場合。どこにパレット固定の設定項目があるのか忘れてしまった、というようなとき。  

普通はマニュアル本をひっくり返したり、Google検索して該当のサイトを探し回るものだが、ChatGPTに聞けばサクッと答えてくれる。  

sunoAIの最近追加された機能なんかもちゃんと教えてくれた。  

Adobeの悪名高いヘルプシステム(フォーラムをたらい回しにされる)に頼る必要はもうないんじゃないか。自分はもうアドビ製品を使っていないので試せないけども。



毎月OpenAIに3千円払っているが、やっとここに来て元が取れる感じがしてきた。  

いい機会なので、僕と生成AIの付き合い方について書き残しておこうと思う。  

次回に続く。

2024年12月22日日曜日

MV追加しました。

 ブルーストンウォークの妖精型宇宙人


先日のテレビで「ミンスパイ星人」としてちょっと取り上げてましたね。
すでに動画は作っていたのに、先を越された感じがしてくやちい。


2024年12月20日金曜日

剥離骨折。

 3日前に足首を挫いて、今日病院に行ってレントゲン撮ったら、

剥離骨折だと診断され、ギプス巻かれてしまいました。
ギプスが取れるのは2週間後の予定。
今は仕事の谷間なので、スケジュールに穴を開けて迷惑を掛けないで済むのは不幸中の幸いかな〜。

ほんとは今年中にコミックスのイラストを上げておきたかったけど、来年にずれ込まざるを得ない。

皆さんもケガには気をつけてください。



2024年12月16日月曜日

MV追加とイスの話

 デボンジャーの悪魔


約30年使ったアーロンチェアがお亡くなりになった。
ガスシリンダーから「ブシュ」とガスが抜ける音と臭いがして、付け根がぐらぐらになってしまった。
94年頃にCBSソニーのカタログ通販で買ったもの。
当時、腰痛に悩まされていて、その斬新なデザインと機能性に一目惚れして即買いした。
当時15万円ぐらいだったと記憶しているが(現在の後継機種は20万円ぐらい)、その後一回も腰痛が再発していないので、後悔してない。よく働いてくれた。
初めて見た時はメッシュの座面の耐久性が心配だったのだが、今もまったくへたっていない。すごい。シリンダーが先にダメになるとは…。
メイン仕事用のイスとしてはずいぶん前に引退していて、音楽制作や動画編集などの趣味の作業用イスとして使っていた。

代わりに買ったイスはこれ。
DXRACERのゲーミングチェア、フォーミュラのファブリック。
寝室でも使っていて、これが2台目。
今は金欠なので趣味のイスに高い金は出せないので、信頼性の高いこれにした。
クリスマスセールで34800円。

今までいろんなイスを使ってきて、失敗もしてきたので、自分のイスに対する要求はけっこう厳しいのだ。

・ランバーサポート必須。
・生地は合成皮革はNG。数年で加水分解でボロボロになる。AKRACER等の高級品は高湿度環境でのテストをしているらしいが、自分はまだ信用していない。
・アームレストにウレタンを使っているのはNG。加水分解でボロボロになる。以前7万円もする国内メーカーのけっこう有名なブランドのイスで、そうなった。国内メーカー、値段だけ見て買うと失敗するという好例。
・座って体を動かして、ギイギイきしるのはダメ。耐久性や機能性に問題なくても、集中力がそがれる。
・座って、クッションがふかふかするのもダメ。リラックス用のイスならば問題ないが、長時間座る作業用のイスには向かない。腰にも悪い。

昔は作業用のイスの選択肢は本当に少なかったが、近年はゲーミングチェアに値段も手頃でいいものが多い。
参考になれば幸いです。





2024年12月6日金曜日

制作工程動画シリーズ追加です

 


録画したまま忘れて放置していた素材があったので、適当に編集してアップしました。

2024年12月2日月曜日

MV追加です

 一年が早いですね〜。

バルバドスの動く棺桶