各大AI厂商要确定其AI的能力,都会提供一些独立的测试评分。市场上有不少相关的测试平台,热门的有OpenCompass丶ARC基准测试丶HellaSwag基准测试等等,中国则有大模型测评机构SuperCLUE等。香港大学经管学院也加入成为测试员,并发 ...
各大AI廠商要確定其AI的能力,都會提供一些獨立的測試評分。市場上有不少相關的測試平台,熱門的有OpenCompass、ARC基準測試、HellaSwag基準測試等等,中國則有大模型測評機構SuperCLUE等。香港大學經管學院也加入成為測試員,並發 ...