探机之家
探机的自我修养
文章
标签
朋友
关于
Tag: LLM
为什么 attention 需要除以sqrt(d)
Jan 7, 2025