跳转至

AI导航

抢走你工作的不是AI,而是掌握使用AI工具的人。 降维打击最为致命:毁灭你,与你何干《三体》

Prompt工程师

navgation 01

navgation 01

应用方向 代表作品 具体表现
文字类 chagpt、brad、copilot
代码编程
办公类 office、WPS
图片类 Midjourney、Firefly
音频类
视频类
跨模态类

AIGC github相关文档汇总

基准测试

以下列出了常见的LLM基础测试类型

  • 大型语言模型难题基准测试(Big Bench Hard, 简称 BBH)
  • 思维链(Chain of Thought, 简称 CoT)
  • 物理互动问答(Physical Interaction Question Answering, 简称 PIQA)
  • AI2推理挑战赛(AI2 Reasoning Challenge, 简称 ARC)简单版和挑战版
  • 社会互动问答(Social Interaction Question Answering, 简称 SIQA)
  • 开放书籍问答(OpenBookQA)
  • 大规模多任务语言理解(Massive Multitask Language Understanding, 简称 MMLU)
  • 斯坦福问答数据集第二版(Stanford Question Answering Dataset version 2, 简称 SQuADv2)
  • 八年级数学8千题(Grade School Math 8k, 简称 GSM8k)
  • Python数学基准问题(Math Benchmark Problems for Python, 简称 MBPP)
  • 人类评估(HumanEva)

捐赠本站(Donate)

weixin_pay
如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))