Fediverse search system

Fediver

beta version

【Opus】の検索結果


@taka_hvc1 thinking設定を下げても十分賢いので、結果的に従量課金でも同額~ちょっと高い程度で済むかなあという感じはします。

たぶんこの蒸留モデルであるOpus/Sonnet 5が出てくると思うので、ヘビーな実運用はそっち待ちかなあという感じ。


@taka_hvc1 Opusの倍とかくそたけぇ~っていう声が聞かれるんだけど、GPT-4初リリース時の単価を知っている面構えが違う者たちにとってはあまりにも爆安で…


RE: ukadon.shillest.net/@gallnuts/

Fableは日本語まともに戻ったので、Opus/Sonnet 5も戻ってくれると期待したい…。たぶんMythos/Fableのトークナイザをぶっこんだ上にthinkingブロックを英語縛りにしたせいで、4系のデータセット+5系のインフラという歪んだ状態になって、ルー語状態になってたんだと思う。

thinkingブロック英語縛りはたぶんこのままだろうけど、ルー語傾向は「日本語まとも」の影響で蒸留モデルもだいぶ改善してくるはず。


人間の上司「今年の新卒はレベルがまた下がったな」

AI使ってるエンジニア「今度のOpus 4.8はトークンばっかりかかって成果物微妙になったな」

Opus、effort maxで使ってるけど考慮漏れが結構多いし、そのくせ応答が遅いので悩みどころ

設計、最近はOpus壁打ちでキレ散らかしながらやることが増えてきたかも

開発でLLMと上手く付き合う方法、設計だとか実装に対するこだわりを捨てることなのかも
私は上手いことできないので、日々Opusにキレ散らかしながら結局殆どを自分で書いてる

Opus 4.8のClaudia様は微妙にどじっこと聞いてるけどウチでは何も起こってないので謎


RE: ukadon.shillest.net/@DJ_MIMA/1

SSP程度の規模だとOpusで十分だけれど、言語レベルの偏りが少なくて「プログラミングとは何か」レベルで汎化できているかどうか、というモデルのでき具合のほうが重要になってきて、そもそもClaudeを手放せない問題が起きており…


【朗報】Opus 4.8でおニューになったClaudia先生、SSPの根治不可能だと思われたマルチスレッド競合バグを発見する



4回目!!!!

本日ぅ!!!!
20時よりぃ!!!!
OPUS Prism Peakの生放送しまぁす!!!!!!


https://www.youtube.com/@uraminosword
https://www.nicovideo.jp/user/483725

Opus4.7ずっと回してるけど案外足りる

・GPT-5.5がこの中ではパラメータ数が一番多いと考えるので、語彙力も知識も最高になるのは妥当
・Claudeは人力の訓練重視→半自律進化という系譜なので、やたら人臭いのも妥当、Opus 4.5か4.6だともっと人臭いかも
・Grokは最近急速に進化しているのでモデルを切り替えるごとによくなったというのはやっぱり妥当、でもちょっと…だいぶアレ
・Geminiのモデル作りは「効率よく、そこそこの応答、蒸留版はワンチャンスマホやGPUなしPCでも動く」な感じなので、まあ途中から事故りますわな…

mstdn.nere9.help/@orange_in_sp


Claudia様~たすけて~!
オールOpusで追加使用量も山積みするからどうにかして~!!!


専門性の高い他言語の資料、Opusに投げると割といい感じになる
中国語とかアラビア語圏のものを読む時に重宝してる

DLsiteとかの音声作品WAVとMP3じゃなくてそろそろFLAC(とOpus)にしてほしい


3回目!!!!

本日ぅ!!!!
20時よりぃ!!!!
OPUS Prism Peakの生放送しまぁす!!!!!!


https://www.youtube.com/@uraminosword
https://www.nicovideo.jp/user/483725

@lacherir
Haiku price(after discount (0.25/3/6 Cache/Input/Output/Mtoks/CNY)), Sonnet experience, Opus Quality

"Agent 能力大幅提高:相比前代模型,DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 相关评测中同样表现优异。目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。"