但諗住遲D用kokoro同whisper-fast整個real time AI chatbot

不過完全唔識搞

想知你點自己script本身都諗住自己script哂,不過如果佢個open-source framework做得好,都慳返好多功夫。有冇人玩過local voice-based home assistant?home assistant就冇玩過
有部Jetson Nano Super放左喺度,8GB VRAM+102GB/s+1024 CUDA cores,應該夠快realtime行Gemma 3n E4B Q4 + Kokoro TTS。
大概會做返Alexa做嘅嘢,開關電器/燈,問各種問題,例如下週天氣,又或者做下Google search(用Google API free tier好似每日有100個query)等等。之後可能做埋video face detection (要upgrade hardware,當phrase 2)。
而家用緊部M1 Mac玩下,俾啲mock up weather information佢,再問返佢下週天氣,適唔適合某種户外活動等,佢都答得幾好,成件事感覺上可行。
睇返好似已經有啲software 做到(e.g. Home Assistant/openHAB)。
有冇Ching玩緊類似嘅嘢
但諗住遲D用kokoro同whisper-fast整個real time AI chatbot係game voice chat到用
不過完全唔識搞
speech to text我明 但點樣將你既text轉做實際既command?