話說最近真係將self hosted AI帶入工作上

252 回覆
79 Like 40 Dislike
2024-11-23 21:34:12
LLM要Open到咩情度先等同Open source哩點暫時重未有具體標準。大如Llama個model都唔係fully transparent,有人屌佢唔夠open,但亦有人因為Llama對localllm嘅貢獻當左Zuckerberg係神。
作為用家,我自己就盡量因應現存客觀因素去判斷用唔用。

而去到公司/機構嘅層面,最好同哂上司/公司嘅IT做下risk management,damage control plan,到時就算有問題都知個liability同對應。

LLM雖然唔成熟,但佢作為一件工具,尤其喺coding同math/science上嘅作用好容易就outweight佢嘅potential risk,至少短時間內未有鑊爆之前好難說服到人唔用LLM。
2024-11-23 21:44:18
雖然qwen 不過好開始, 鼓勵
2024-11-23 21:50:48
希望Llama同Mistral會生性
暫時open-weight model入面,打code數理嘢真係Qwen/Deepseek(Chinese LLMs)玩哂,
而家Deepseek仲出左隻好似ChatGPT-o1咁reinforcement learning-based嘅reasoning model,大家都玩得好𠹌開心
2024-11-23 23:06:39
G持
2024-11-23 23:28:42
最好笑係上面好多人負評樓主用大陸model
屌你地班友平時寫web用vue又唔計?
2024-11-23 23:36:51
想知樓主有冇玩埋rag
2024-11-23 23:43:04
mind map依啲要AGI
邊有咁先進可以做到
2024-11-23 23:53:20
我見出面有d youtube summary 有
2024-11-24 00:23:00
safetensors就一定冇加
2024-11-24 00:26:38
其實可以加咩料係weight入面
2024-11-24 02:35:36
DeepSeek-R1-Lite-Preview ?
2024-11-24 03:26:33
屌佢老味 DeepSeek-R1-Lite-Preview 出左三日 alibaba就成功抄左
https://github.com/AIDC-AI/Marco-o1?tab=readme-ov-file



BTW 試左DeepSeek-R1-Lite-Preview real-world係追唔上 o1-preview
問左幾條數學題都係得o1答啱
就算比兩個答案佢揀 問邊個先啱都係得o1揀啱
2024-11-24 03:40:01
welcome to lihkg 軟件台
2024-11-24 03:40:37
on 9仔論壇你期望d咩
2024-11-24 07:25:38
留名學野
2024-11-24 09:01:21
話咁快(好似)又有新SOTA open model:
https://www.reddit.com/r/LocalLLaMA/s/TYnTfYv24T

Athene-V2-Chat-72B by
@NexusflowX
debuts as the best open model, matching proprietary models like GPT-4o/Sonnet in technical domains (e.g., math, coding, hard prompts)!
2024-11-24 09:52:09
你完全表達出你有幾無知
2024-11-24 10:03:48
有排都未追到啦 先唔講你淨係吹hard prompt 其實野答到一舊屎咁 比你搬埋龍門 95CI 都輸比chatgpt-4o-latest


呢幾檔benchmark都未出就係度鳩吹matching proprietary models like GPT-4o/Sonnet in math, coding, hard prompts 講math佢肯定唔夠r1黎

https://livecodebench.github.io/leaderboard.html
https://livebench.ai/#/
https://simple-bench.com/
2024-11-24 10:23:55
所以d人話唔洗加咁多ram 同埋我都冇錢加

你張3090 係邊買?
2024-11-24 10:31:16
我唔係住香港,哩邊3090全新約一萬,
二手就5000左右。

我上面個價應該喺香港都要二手先得。
樓主好似都七千入左張,可以問下佢
2024-11-24 10:33:49
都係當rumor睇
佢好似都係由其他(Qwen 2.5 72B)train過來。
2024-11-24 11:07:39
2024-11-24 12:32:59
lm
2024-11-24 12:42:26
2024-11-24 13:39:24
我都想玩,但唔識
如果有人有入門教學既話,請分享下
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞