神代クロ のすべての投稿

OpenAIのChatGPT以外のサービスまとめてみた

OpenAIはメインのChatGPT以外にも様々なサービスを提供しています。それらをまとめてみました。

商用向けサービス

OpenAI API
・2020年6月リリース
・OpenAIが提供する汎用AIサービスで、GPTシリーズなどの大規模言語モデルにアクセスできるAPIです。

OpenAI Codex(コード自動生成)
・2021年8月~2023年3月
・自然言語からプログラミングコードを生成できるAIモデルです。GitHubの自動補完ツール「Copilot」のエンジンとして使用され、複数の言語でコーディング支援を行いました。

Whisper(文字起こし)
・2022年9月リリース
・音声をテキストに変換する自動音声認識システムです。多言語の文字起こしだけでなく、他言語音声から英語への翻訳も可能なモデルです。モデルとコードがオープンソースで公開されており、誰でもローカル実行できます。

Embeddings(ベクトル埋め込み)
2020年6月リリース
・テキストやコードをベクトル(数値列)に変換するサービスです。埋め込みベクトルはテキストの意味的な類似度計算や検索、クラスタリングに利用できます。

DALL·E(画像生成)
・2021年1月リリース
・入力したテキストの説明に基づき、新規の画像を生成するシリーズモデルです。
・DALL·E 2(2022年7月)は解像度や写実性が大きく向上し、複数の概念や作風の組み合わせも可能になりました。
・DALL·E 3(2023年10月)は大幅に指示理解力を高めてより対話的に画像生成できるようになっています。
・現在は4o Image Generation(2025年3月)としてChatGPTに統合済みです。

Moderation API(有害データ判定API)
・2022年8月リリース
・テキストや画像に有害な内容が含まれていないかを自動判定するコンテンツ審査用サービスです。性的・暴力的表現やヘイトスピーチ、自己傷害の助長などポリシー違反の可能性があるかを分類モデルで検出します。

研究向け・実験的サービス

Sora(動画生成)
・2024年12月リリース
・テキスト、画像、動画などを入力して、新たな動画クリップを生成できるモデルです。短いプロンプトから最大20秒程度の映像を作成でき、既存動画の様式を変換したり、2つの動画を融合することも可能です。

Operator(サイト自動閲覧)
・2025年1月リリース
・ウェブ上のタスクを自動で実行するエージェントAIです。商品の注文や旅行予約、ウェブ上での定型業務を人間の代わりにこなすことができます。利用はまだ米国のProユーザ限定です。

Deep Research(ディープリサーチ)
・2025年2月リリース
・インターネット上の大量の情報を自動収集・分析し、複数段階の調査タスクを遂行してレポートを作成するエージェント機能です。人間のリサーチアナリストが数時間かける調査を数十分で完了できます。

ChatGPT Tasks(スケジュール機能)
・2025年1月リリース
・「毎朝8時にニュース要約を送って」や「来週○日にリマインドして」といったタスクを設定でき、指定時刻になるとChatGPTが自律的にプロンプトを実行し結果を通知します。

ChatGPT統合機能

ChatGPT Voice(音声会話機能)
・2023年9月リリース
・ユーザがマイクから話しかけると音声認識(Whisper)でテキスト化され、それに対する応答をChatGPTが音声合成で返します。2024年にはGPT-4ベースの高度音声モード(Advanced Voice)も登場し、より自然で表現力豊かな音声応答が可能になりました。

ChatGPT Vision(画像理解機能)
・2023年9月リリース
・画像をアップロードして、その内容を解析・理解させる機能です。例えば写真の解析、図表の説明、手書きメモの読み取り、あるいは画像中の不具合箇所の特定など、視覚情報をテキストで説明します。この機能により、ChatGPTは「見る」能力を獲得しました。

ChatGPT Memory(メモリー機能)
・2024年9月リリース
・ユーザとのこれまでの対話内容やユーザが明示的に教えた情報をChatGPTが長期間保持し、今後の会話に活かす機能です。2025年4月のアップデートでは、保存メモリーに加えて過去のチャット履歴全体も参照されるようになりました。

ChatGPT Browsing(ブラウジング機能)
・2023年5月リリース
・インターネット上の最新情報を検索・取得して回答に反映する機能です。新しいニュースや出来事についてもChatGPTが最新知識をもとに回答できるようになりました。2023年9月に「Browse with Bing」として再リリースされました。

ChatGPT Code Interpreter(コードインタープリタ)
・2023年7月リリース
・ユーザがデータ処理や計算をチャット内で依頼すると、モデルがPythonスクリプトを生成・実行し、その結果を回答として返します。例えばCSVデータの分析やグラフ作成、画像の編集、数値計算などをChatGPTが自律的に行います。後に「Advanced Data Analysis」に改称されました。

ChatGPT Plugins(プラグイン機能)
・2023年5月リリース
・外部のサービスやデータベースと連携する追加機能をChatGPTに組み込める拡張機能です。OpenAIが提供した公式プラグイン(BrowsingやCode Interpreterなど)に加え、サードパーティ企業が提供する何百ものプラグイン(例: レストラン予約のOpenTableや計算エンジンのWolframなど)が利用可能でした。

まとめ

この記事はDeep Researchを元に書いてます。かなり手直ししてるけど。

最近のサービスでは画像生成が素晴らしいね。動画生成はまだいまいち。そろそろエージェントAIで凄いの来るかな。

ChatGPT各バージョンの特徴まとめてみた(o4-mini-highまで)

日頃お世話になっているOpenAIのChatGPT。今まで出てきたモデルを改めて確認してみた。

各モデル比較

ごちゃごちゃしてきたので表にしました。

モデルIQ検索推論コンテキストウィンドウリリース
GPT‑3.5644,0962020/07
GPT-48132,7682023/03
GPT-4o92128,0002024/05
o1122200,0002024/12
o3136200,0002025/04

IQ(知能指数)はネットから引っ張ってきた参考値です。
コンテキストウィンドウは記憶できるトークン数です。
リリースは正式版が公開された月です。

GPT‑3.5

・2020年7月~2024年7月
・初期の無料版モデル
・自然な会話生成や基本的な質問応答に優れている
・テキストや数値データの処理に特化

GPT‑4 シリーズ

GPT‑4
・2023年3月~2025年4月
・自然言語理解の精度が向上し、より一貫性のある回答が可能
・安全性や誤情報の低減対策も強化

GPT‑4.5 Preview
・2025年3月~2025年7月
・教師なし学習で性能向上
・モデルサイズはOpenAI史上最大

GPT‑4.1
GPT‑4.1 mini
GPT‑4.1 nano
・2025年4月リリース
・API専用モデル
・コンテキストウィンドウ100万トークン
・miniとnanoは軽量版

GPT‑4o シリーズ

GPT‑4o
・2024年5月リリース
・oはomni(全て・あらゆる)
・マルチモーダル機能が強化され、画像や音声も同時に処理できる
・処理速度は前モデルの約2倍と非常に高速で、非英語圏の言語サポートも強化
・より正確で多様な課題に対応
・2025年1月タスク機能ベータ版追加
・2025年3月画像生成機能追加

GPT‑4o mini
・2024年7月リリース
・低コストかつ高速な処理が可能
・API利用時のコストも大幅に削減され、約3~4%程度の料金で利用できる
・ただし一部機能は制限される

o1 シリーズ

o1
・プレビュー版2024年9月リリース
・正式版2024年12月~2025年4月
・従来のモデルとは異なり、「じっくり考える」能力を重視
・数学、物理、科学、プログラミングなどの高度な推論で人間の博士レベルに近い性能を発揮

o1 mini
・2024年9月~2025年4月
・o1に比べて低コストで推論が実行できる

o1 pro mode
・2024年12月リリース
・高額会員専用モデル(月額200ドル)
・o1に追加の計算資源を使ってさらに難解な問題に最適化されている

o3 シリーズ

o3-mini
・2025年1月~2025年4月
・より軽量かつ高速なモデルで、モバイルアプリやリソース制約のある環境での利用に適する
・o1-miniの後継としてさらに推論力が向上している
・2025年2月Deep Research追加

o3-mini-high
・2025年1月~2025年4月
・o3‑miniよりもさらに深い思考プロセスを経るように設計されている
・数学や科学、プログラミングなどのSTEM分野においてより正確性や詳細な解析結果を提供

o3
・2025年4月リリース
・GPT-5延期により急遽リリースされた
・最も強力な推論モデル
・IQ136
・2025年4月タスク機能追加

o4 シリーズ

o4-mini
・2025年4月リリース
・GPT-5延期により急遽リリースされた
・高速・低コストで推論できるよう最適化されたモデル
・2025年4月タスク機能追加

o4-mini-high
・2025年4月リリース
・GPT-5延期により急遽リリースされた
・o4-miniの高性能版

まとめ

とにかく進化が凄まじいね。初期は嘘ついたり変なコード書いたりしてたのに、今じゃ信頼性上がって仕事上のパートナーと言っても過言じゃない。

ちなみに、初めてChatGPTに触れたのはBingAIでした(中身がGPT-4)。これは凄いと思い、2023年3月に有料プランに申し込み使い続けています。

今後の進化も楽しみです。

特定保健指導に行く

自治体の無料特定健診に行ったらいくつかの項目が引っかかったので、特定保健指導を受けることになりました。どうせ「痩せろ」と言われるだけだろと行く気はなかったんだけど、2回も電話で催促されたので。

管理栄養士の人から案の定「痩せろ」と言われましたw 計画を立てることになり、3ヶ月で3kg痩せると伝えると「3ヶ月で2kgが良い」と訂正されました。3kgだと1日300kcal減らす必要があり、確かに大変そうです。

テレワークで家から一歩も出ない日があるので毎日出歩くようにする。酒は控える。ご飯少なめにする。これで1日200kcal減らせるようです。それなら何とか。

今後指導はないけど、無料で管理サイトが使えるようになり、それで自己管理する仕組みらしい。

まあせっかくなので頑張ろう。これで夏には細マッチョだなw

ChatGPT-4oの画像生成で巫女さん描かせてみた

ChatGPT-4oで画像生成できるようになったので、巫女さんを描かせてみました。

これは細かい指示なしの一発画像なので、ちょっと身体のバランスが悪いかな? でも可愛く描けてる。

座らせてみた。

袖のマークはたぶん千早の模様だろうな。

刀を握らせてみた。

最初上の画像のキャラそのままだったんだけど、変な形の刀持ってたので何度か描き直させたら、ちょっとキャラ変わっちゃった。


4コマ漫画を描かせてみた。

特にネタは指定しなかったんだけど、なぜかメイドさんが巫女さんに昼寝を促す内容に。しかも3コマ漫画だw

少し漢字が怪しいけど日本語書けてるな。

話題のジブリ風。

それっぽい。

最後はソシャゲ風にしてもらった。

このゴテゴテ感。確かにソシャゲだw

まとめ

AIの画像生成って絵柄やポーズが毎回変わるのが普通だったけど、ある程度保持したまま生成できるようになって良い。

しかも「リボンつけて」とか「足袋はかせて」という細かい指示にもちゃんと対応する。素晴らしい。

PICO Motion Tracker Waist Version 買った。さらに自然な動きに

PICO Motion Tracker Waist Version買いました。数日前急に発表・発売されたんで驚いたよ。

既にPICO Motion Tracker持ってるので、この腰トラ1個買って6点トラッキングになりました。

初期設定

腰に巻いてトラッキング開始! と始めたものの、なぜか認識せず。赤青に点滅して充電切れかなあと思ったけど、そうでもない。

よく見たら腰トラの設定位置が「ウエストの後ろ」になってたよ。前側に変更したら問題なく認識しました。後ろでも認識するんだね。

相変わらず簡単設定で良い。

使用感

・Dance Dash
ちゃんとアバターが動くようになりました。
今までもプレイはできてたんだけど、アバターは動かなかったんだよね。たまに手を足だと誤認したり。

・VRChat
これまでも足トラだけで腰が動かせてたんだけど、あくまでエミュレーションなのでうまくポーズが取れなかったり、座ると変になったりしてたんだよね。

PICO4Ultraは最近のアップデートで改善されたみたいだけど、うちのは無印PICO4だし。

かがみポーズ好き。

今までもこのポーズできてたけど、より自然な感じになって良い。

振り向きポーズも違和感なく。

それにしても右近弐式ちゃんは可愛いなw

座りポーズ。

まだあんまり試してないけど良くなってる気がします。

まとめ

足トラが優秀だったので、そこまで大きな変化はないけど、こういう細かな部分が大事だよね。

ソニックカラーズ アルティメット クリア(ネタバレ)

ソニックカラーズ アルティメットクリアしました。クリア時間は5時間です。

PS Plusフリープレイでもらったものです。

システム

2010年のカラーズを2021年にリマスターしたものです。

難易度は低め。

しかし終盤の軌道エレベーター下る所と、その後のラスボス戦でやられまくったよ。難しかったというより覚えゲーだった。

今作の売りのカラーパワー。普段と違うアクションできるのは良いけど、使用範囲は限定的だったな。トロコンまでやろうとすると必要になるのかもしれないけど。

ムービーになると途端に画質が落ちるw オリジナル版の使い回しかな。そしてたまに普通画質になるのは多分追加ムービーだな。

ストーリー

エッグマンが宇宙に遊園地を作ったので、ソニックテイルスは軌道エレベーターに乗って行ってみることに。

案の定そこにはエッグマンの企みがありました。いつも通りだね。

惑星を複数持ってきて遊園地に改造、ボスキャラは宇宙船だったり観覧車だったりと規模がでかい。

エッグマンは惑星にいるウィスプたちを捕まえてカラーパワーを抽出し、その力で全人類を洗脳して世界征服しようとしてました。

ソニックが各惑星のジェネレーターを破壊し、エッグマンの部下のミスか何かで洗脳装置も自爆。

最後は崩壊しつつある軌道エレベーターでエッグマンと直接対決して勝利、地球に帰ってこれました。

メデタシメデタシ。

まとめ

プレイ時間短めでサクッとクリアできて満足です。

実はソニックバンドル持ってるので、他のソニックもそのうちやっていこう。

デスクトップパソコンGALLERIA ZA7C-R57T(RTX5070Ti)購入

GALLERIA ZA7C-R57T購入しました。ドスパラのBTOです。

今使ってるPCは5年以上前のでYouTube見るだけでもファンが回ったり、VRがガクガクだったりして厳しかったんだよね。

スペック

CPU:Intel Core Ultra 7 265KF (最大5.5GHz)
MEM:32GB
GPU:NVIDIA GeForce RTX 5070 Ti 16GB
SSD:2TB
LAN:5Gbps
WLAN:Wi-Fi7(802.11be)+Bluetooth5.4
OS:Windows11 Pro 64bit

前のPCからCPU性能3倍、GPU性能1.8倍になりました。メモリやSSDも2倍にしています。ついでに電源も2倍。これでだいぶ余裕になるだろう。

IntelもNVIDIAも最近不具合出してるのが気になったけど、引き続き使うことにしました。

今回初めてCPUファンを水冷式にしました。静音性に期待。

LANは5Gbpsと前の5倍になったけど、うちのルーター1Gbpsだった。買い替えかなあ。

しかしミドルスペックからミドルスペックへの買い替えなのに、お値段2倍になったよ…

初期設定

まず箱から出して「でけぇ」と思ったw

重量が10kgから14kgに増加、体積は1.8倍になりました。ちゃんと収まったから良かったけど、想定より大きかった。

毎回OneDriveの停止に手間取る。勝手にフォルダ変更されて戻すのがほんと面倒だ… あとは無心でアプリインストール&設定。まだ途中だけど使えるようにはなった。

何もしてなくても常に低速でファンが動いてる気がする。これは仕様? まあ後で設定確認しよう。あと起動時勝手にBIOS画面が立ち上がることがある。これも設定あるのかな?

Bluetoothワイヤレスイヤホンが認識するけど音が途切れまくりで使えなくなった。Windows11になったから?
→原因判明。同梱のアンテナを本体に挿す必要があった。

GeForceのドライバアップデートが来てる。今は正常に動いてるので更新しない方がいいのかなw

結構な確率で起動時にBIOS画面が立ち上がる。設定いじったりサポートに問い合わせたりしたけど解決せず…

使用感

前のPCはメモリ使用率がいつも50%以上で、少しでも重い処理するとガクガクしてたんだけど、それが無くなった。普段の操作もキビキビしてる。素晴らしい。

早速VRゲームやってみた。グラフィック設定を2段階上げてもフレームレートが高い状態になっている。良い感じ。最適な設定は試行錯誤しつつかな。

VRChatも綺麗になってる。今まで建物がハリボテっぽい感じしてたのに違和感だいぶ減った。空気感も変わった感じ。良いね。

あと今まで集会に行くと、最低画質にしても20~30fpsしか出なくてたまに落ちたりしてたけど、これなら大丈夫そうだ。

PCゲームはこれからプレイだけど、グラフィック設定上げて綺麗な画面でプレイできそうです。

Steamのゲームはいくつかクラウドセーブに対応してないみたいで、最初からやり直しになりました。前のPCから持ってこれるけど、音ゲーのスコアくらいだし別にいいか。

そういえばおまけで「Minecraft: Java & Bedrock Edition for PC」「PC Game Pass 1ヶ月分」が付いてきました。そのうちやろう。

まとめ

いくつか気になることはあるけど、期待通りの性能で問題なく使えそうです。

今後ゲームや開発など、PC重いからって止めてたことをやっていくつもりです。

Cursor使い始めた。エージェント機能便利すぎる

知人から「Cursor使ったら開発効率2倍になった」と聞いたので、2倍は言いすぎだろうと思いつつ試してみました。

結論から言うと、確かにこれは2倍になるわ。

今までのAI利用

ChatGPTにコードの雛形を書かせたりエラー内容を調べさせています。
そしてGithub Copilotでコード補完しつつ自分で書いていく、みたいに使ってました。

これだとほんとに補助程度しかなく、ほぼ自分で考えてコーディングする必要がありました。ググるのが多少減るくらいの効果です。

Cursor使う

VSCodeクローンでVSCodeから設定引き継げるので、すんなり始められました。

Cursorは他社のAIモデルを使ってコーディングを助けてくれる仕組みです。

AIモデル選択はとりあえずAutoにしてるけど、Claude 3.5 SonnetやGPT-4oが使われてるみたい。界隈ではGemini 2.5 Proが使えるようになったと話題になってるね。

使い始めてすぐ気づいたのはAIが優秀なこと。これはエージェント機能が使われていて、プロジェクト全体を見回して自動でコーディングしたり不具合見つけたりしてくれます。これが物凄く便利です。

エージェント機能実例

「トップページの表示が遅いので速くして」ってチャットに書き込みました。
すると…

トップページのパフォーマンス問題について調査させていただきます。

Nuxt.jsプロジェクトのようですね。トップページのコードを確認します。

トップページのパフォーマンス問題について、以下の改善点が見つかりました

改善案を実装させていただきます

凄すぎない? 自動でコード書き換えて高速化しちゃったよ。

追加でDBのインデックス張る作業もしてもらいました。そっちも自動でDockerコンテナ調べてDBにログイン、テーブル構造確認して最適なインデックスを出してきたよ。素晴らしい。

このプロジェクトはNuxt.js+TypeScriptで書かれていて、あんまり詳しくない物だったので大いに助かりました。

たまにsudoし忘れたり、ディレクトリ変更しないで実行しようとしてやり直してるのが面白い。ローカルでミスる分には問題ないし、むしろ可愛げがあってよろしいw

制限のためProに課金

最初はトライアルで高速プレミアムリクエストが150回あったんだけど、3日で使い切ってしまいました。無料版だと低速で50回しか使えないので、実質Pro版しか選択肢ないね。

そんな訳でProに課金しました。Proでも高速500回しか使えないけど、効率的な使い方がわかってきたし、低速であれば無制限らしいので何とかなるでしょう。

ちなみにトライアル使い切ったタイミングでCursorのサービスがダウンしたので、何か制限食らったのかと焦ったよw

まとめ

エージェント機能が素晴らしすぎる。今までとは全く違う手法になっていくね。開発効率は間違いなく上がる。

そのうちCopilotとかも追いついてくるだろうけど、それはそれで楽しみです。

【OKIVFES 2025】初音ミクのライブなど見に行く

VRChatでOKIVFESという沖縄のイベントをやってますが、気づいたら最終日だったので慌てて行ってきました。

根間ういのライブ。ファンサとか知ってる曲があって嬉しい。

この子のこと知ったのは3年くらい前か。沖縄の曲あんまり聞かないので印象に残ってた。

「沖縄で好きになった子が方言すぎてツラすぎる」というアニメの2人。

アニメ見てないけどどのくらい方言凄いんだろ。

しぐれういデザインの初音ミク可愛い。

しかし、しぐれういと根間ういか…

ミクさん2枚目。

ライブの写真撮るの難しいね。

ミクさん3枚目。

最後の曲はメルトでした。懐かしい。

クォリティの高いライブで満足でした。ライブ以外にも色々あったみたいだけど行けなかったな。また来年だ。

ドラゴンボールZ カカロット 人造人間編までクリア(ネタバレ)

ドラゴンボールZ カカロットを人造人間編までクリアしました。クリア時間は21時間です。

PS Plusゲームカタログにてプレイしたものです。これも今月で消えるので急いでやった。

システム

ドラゴンボールのゲームやるのは多分ファミコンの初代以来です。いっぱい出てるのにね。

キャラの再現度が素晴らしい。一部キャラに少し違和感ある以外はアニメのままって感じ。まあ動きはぎこちないけどね。効果音もアニメまんまでニヤッとするw

戦闘はほぼ攻撃ボタン連打するだけで単調だった。たまに必殺技出すくらい。

戦闘に勝ってもストーリー展開では負け扱いになるのがもにょる。

サブストーリーはアイテム採取か敵を倒すのしかないけど、原作を補完するサブストーリーは良かったな。

ストーリーは全体的に淡々としてた。内容知ってるからそう感じたのかもしれないけど。あと一部セリフが省略されてたのが残念。

以下、ストーリーは今更書くまでもないので気になったものだけ。

サイヤ人襲来編

クリア時間は3時間半。

「戦闘力… たったの5か… ゴミめ…」

大物感出してて実際強かったけど、フリーザ軍では下っ端だったんだろうな。

「クンッ」

これを見に来たw 強いオッサン良いよね。

悪の帝王フリーザ編

クリア時間は6時間半。

西の都にあるカプセルコーポレーション。街の真ん中にあるんだな。ゲームだけの設定かもしれないけど。

こうやって街を歩き回れるのもゲームならではで良いね。

サイバイマンに殺されたヤムチャ。生前たくさんの女の子とデートの約束してたので、変わりにプーアルが変身して相手してたというw

これはブルマとくっつかないわ。

フリーザザーボンドドリア。この3人の安定感よ。

「きたねえ花火だ」いただきました。うれしそう。

ギニュー特戦隊のリクーム。存在忘れてたけど、強いし変なポーズだしで再評価したわw

「わたしの戦闘力は530000です」

この絶望感よ。しかしこのセリフ、作中ではネイル1人に言ったんだね。

戦慄の人造人間編

クリア時間は11時間。

伝説のアニオリ、悟空ピッコロが運転免許を取りに行く話があるとはw

ここだけレースゲームになってて面白かった。

謎の女研究員。見たことあるなと思ったら人造人間21号らしい。ゲーム中では特に説明なかったけど。

悟空の育ての親孫悟飯の家とか調べてた。てゆうか悟空の家のすぐ近くに家あったんだな。

たまにフィールドにいたピラフ一味と悟空がついに遭遇。

悟空を倒すためのロボのパーツを悟空に探させたり。

人造人間8号ことハッチャンの調子が悪いので、悟空が修理の手伝いをする。

そのサブストーリーが「永遠の友」ってタイトルでジーンと来た。

チチはいつも「キー」ってなってるイメージだったけど、ゲームだと一番可愛いな。

キーってなるの魔人ブウ編からだっけ?

衝撃の事実。この世界の獣人たちはアニマリンという薬で獣人化していた。まあウーロンとかは元から獣人みたいだけどね。

獣人化を治す薬の材料であるゴールデンガゼルの角がなかなか入手出来なくて苦労した。

ドラゴンボールでナッパを生き返らせたら修行相手になってくれた。

禁断のネタ、ハゲは超サイヤ人になったらどうなるのかという疑問をつぶやく悟飯w

セルかっこいい。しかしやけに「ぶるぁぁ」な口調だったなw アニメもこんなんだっけ?

未来トランクスの話が全くなかった。有料DLCらしくて残念…

まとめ

原作知ってるしなあと思いながらはじめたけど、結構楽しめました。やっぱりドラゴンボールは最高だ。

「復活の魔人ブウ編」は時間的に無理でした。原作補完のサブストーリーたくさんあったのでブウ編でも期待できそうだったけど、まあいいや。