gpt o1 pro 收200鎂一個月

月球上的人（0）

25 回覆

0 Like 7 Dislike

月球上的人（0） 2024-12-06 06:39:00

點畀

邊個畀

真天真 2024-12-06 07:14:27

你唔比
唔係點會有免費版其他人用

全倉IBM 2024-12-06 08:43:43

叫羅冠聰比

素食狗狗 2024-12-06 15:16:00

用o1 夠做喇

搵到個任用o1 都係$20

千秋千 2024-12-06 15:17:34

商業用途，教育用途，tech nerd

三生三死十個肺花 2024-12-06 15:25:34

可以完整寫個App出嚟未？

Solik 2024-12-06 16:58:56

開心share

柏迪 2024-12-07 00:36:54

開心share 我都想要

晴天雨天讀書天 2024-12-07 01:00:13

留tg, 叔叔收你$5
收1000個人每月，好快財自

Outliers 2024-12-07 02:19:53

有冇啲評測睇吓？

小必廚 2024-12-07 02:41:21

官方chatgpt plus 個 o1-preview 轉左做o1

旋風管家一拳超人 2024-12-08 15:59:17

根本就唔係服務你呢類顧客

人哋服務大公司

月球上的人（0） 2024-12-09 04:05:15

遲啲

月球上的人（0） 2024-12-09 04:05:30

但係未出api

旋風管家一拳超人 2024-12-09 12:09:30

素食狗狗 2024-12-11 14:21:23

Studio Global AI

Monica ai

留意唔係o1 pro

Outliers 2024-12-11 14:56:40

o1 pro搞唔掂最難數學比賽Putnam Exam喎

月球上的人（0） 2024-12-11 15:55:16

都喺嗰句
你畀個小學生100 個鐘 1000個鐘
佢都唔會做到啲好勁嘅嘢

所以我不嬲都覺得so called test-time compute/ inference scaling 成件事好scam

唔係冇用
但係我覺得始終base model 嘅raw intelligence 緊要啲

power_off 2024-12-11 19:45:17

火雞版係咪會平啲

乂蠔情 2024-12-12 10:10:00

可以邊學邊做

高普巴打 2024-12-12 10:13:12

有gpt iso免裝破解開心version，要留pm

月球上的人（0） 2024-12-20 00:08:40

呢個係一個比較多人睇嘅benchmark
o1 最近先有api
o1 pro 未有api 應該所以未有

reasoning 嗰part 91+
高過其他model 好多
但係translate 唔到去math同埋coding (尤其math)
coding 同math 相對underwhelming
以咁嘅成本嚟講 coding 淨係高sonnet +2.5
數仲差過gemini 1206 -4.3
可能證明llm 都係outside training data 冇乜用冇乜generalize 嘅能力

o1 pro 其實都有幾份benchmark 係open ai 自己公佈
包括係aime (數），competition coding , GPQA (phd science)
唔算好大進步

個差別比較大嘅係當model 係4/4 答啱嗰陣先計答啱

SWE Bench agentic coding benchmark (好似係）比sonnet 表現差少少
有趣嘅係Flash 2.0 作為一個應該<100b 嘅細model SWE Bench 會係#1
Livecodebench 我唔識睇

月球上的人（0） 2024-12-20 00:15:17

btw
根據返livebench 個數學個分
三個月前math sota 嘅model 係gemini pro 1.5 002 (version date: Sep 24)
依家係gemini 1206 (version date: Dec 06)
個分係由58 去到71

我試過攞過dse 2017 份mc 去test 兩個model
兩次都係用最鬆嘅方式test (run 兩set 嘅prompt, 一set 就咁copy and paste 條題目, 一set 就用cot prompt, 兩個prompt 啱一個當佢啱）
三個月前llm 答到36/45 並且好多都要用cot prompting 先答到
今日答到42/45 淨係得幾題要用cot prompting

第 1 頁

吹水台自選台熱　門最　新手機台時事台政事台 World 體育台娛樂台動漫台 Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑　洞