AI导航草稿
抢走你工作的不是AI,而是掌握使用AI工具的人。 降维打击最为致命:毁灭你,与你何干《三体》
Prompt工程师
应用方向 | 代表作品 | 具体表现 |
---|---|---|
文字类 | chagpt、brad、copilot | |
代码编程 | ||
办公类 | office、WPS | |
图片类 | Midjourney、Firefly | |
音频类 | ||
视频类 | ||
跨模态类 |
基准测试
以下列出了常见的LLM基础测试类型
- 大型语言模型难题基准测试(Big Bench Hard, 简称 BBH)
- 思维链(Chain of Thought, 简称 CoT)
- 物理互动问答(Physical Interaction Question Answering, 简称 PIQA)
- AI2推理挑战赛(AI2 Reasoning Challenge, 简称 ARC)简单版和挑战版
- 社会互动问答(Social Interaction Question Answering, 简称 SIQA)
- 开放书籍问答(OpenBookQA)
- 大规模多任务语言理解(Massive Multitask Language Understanding, 简称 MMLU)
- 斯坦福问答数据集第二版(Stanford Question Answering Dataset version 2, 简称 SQuADv2)
- 八年级数学8千题(Grade School Math 8k, 简称 GSM8k)
- Python数学基准问题(Math Benchmark Problems for Python, 简称 MBPP)
- 人类评估(HumanEva)
捐赠本站(Donate)
如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))