gpt o1 pro 收200鎂一個月

25 回覆
0 Like 7 Dislike
2024-12-06 06:39:00
點畀
邊個畀
2024-12-06 07:14:27
你唔比
唔係點會有免費版其他人用
2024-12-06 08:43:43
叫羅冠聰比
2024-12-06 15:16:00
用o1 夠做喇

搵到個任用o1 都係$20
2024-12-06 15:17:34
商業用途,教育用途,tech nerd
2024-12-06 15:25:34
可以完整寫個App出嚟未?
2024-12-06 16:58:56
開心share
2024-12-07 00:36:54
開心share 我都想要
2024-12-07 01:00:13
留tg, 叔叔收你$5
收1000個人每月,好快財自
2024-12-07 02:19:53
有冇啲評測睇吓?
2024-12-07 02:41:21
官方chatgpt plus 個 o1-preview 轉左做o1
2024-12-08 15:59:17
根本就唔係服務你呢類顧客

人哋服務大公司
2024-12-09 04:05:15
遲啲
2024-12-09 04:05:30
但係未出api
2024-12-09 04:06:38
2024-12-09 12:09:30
2024-12-11 14:21:23
Studio Global AI

Monica ai

留意唔係o1 pro
2024-12-11 14:56:40
o1 pro搞唔掂最難數學比賽Putnam Exam喎
2024-12-11 15:55:16
都喺嗰句
你畀個小學生100 個鐘 1000個鐘
佢都唔會做到啲好勁嘅嘢
所以我不嬲都覺得so called test-time compute/ inference scaling 成件事好scam
唔係冇用
但係我覺得始終base model 嘅raw intelligence 緊要啲
2024-12-11 19:45:17
火雞版係咪會平啲
2024-12-12 10:10:00
可以邊學邊做
2024-12-12 10:13:12
有gpt iso免裝破解開心version,要留pm
2024-12-20 00:08:40


呢個係一個比較多人睇嘅benchmark
o1 最近先有api
o1 pro 未有api 應該 所以未有

reasoning 嗰part 91+
高過其他model 好多
但係translate 唔到去math同埋coding (尤其math)
coding 同math 相對underwhelming
以咁嘅成本嚟講 coding 淨係高sonnet +2.5
數仲差過gemini 1206 -4.3
可能證明llm 都係outside training data 冇乜用 冇乜generalize 嘅能力

o1 pro 其實都有幾份benchmark 係open ai 自己公佈
包括係aime (數),competition coding , GPQA (phd science)
唔算好大進步


個差別比較大嘅係當model 係4/4 答啱嗰陣 先計答啱


SWE Bench agentic coding benchmark (好似係) 比sonnet 表現差少少
有趣嘅係Flash 2.0 作為一個應該<100b 嘅細model SWE Bench 會係#1
Livecodebench 我唔識睇

2024-12-20 00:15:17
btw
根據返livebench 個數學個分
三個月前math sota 嘅model 係gemini pro 1.5 002 (version date: Sep 24)
依家係gemini 1206 (version date: Dec 06)
個分係由58 去到71

我試過攞過dse 2017 份mc 去test 兩個model
兩次都係用最鬆嘅方式test (run 兩set 嘅prompt, 一set 就咁copy and paste 條題目, 一set 就用cot prompt, 兩個prompt 啱一個當佢啱)
三個月前llm 答到36/45 並且好多都要用cot prompting 先答到
今日答到42/45 淨係得幾題要用cot prompting
2024-12-20 00:35:25
lm
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞