arXiv:2303.08774cs.AI3/27/2023

GPT-4 Technical Report

作者：OpenAI Team

目录

GPT-4技术报告模型概述主要特性 1. 多模态能力 2. 性能提升基准测试结果学术考试表现专业考试安全性考虑局限性

GPT-4技术报告

模型概述

GPT-4是OpenAI开发的大规模多模态模型，能够接受图像和文本输入，产生文本输出。这是继GPT-3.5之后的重大升级。

主要特性

1. 多模态能力

•图像理解：可以理解图片内容并回答相关问题
•图表分析：能够解读复杂的图表、图形和数据可视化
•文档处理：处理包含图像的复杂文档

2. 性能提升

•准确性：在各种基准测试中显著优于GPT-3.5
•推理能力：在复杂推理任务中表现更佳
•创造性：在创意写作和问题解决方面有明显改进

基准测试结果

学术考试表现

•SAT阅读写作：710/800 (93rd percentile)
•SAT数学：700/800 (89th percentile)
•AP微积分BC：4/5
•AP物理2：4/5

专业考试

•统一律师考试：298/400 (88th percentile)
•LSAT：163 (88th percentile)

安全性考虑

OpenAI在GPT-4的开发中特别重视安全性：

•对抗性测试：与50多位专家合作进行红队测试
•幻觉减少：相比GPT-3.5，事实性准确度提高19%
•拒绝响应：对不当请求的拒绝率提高29%

局限性

尽管性能显著提升，GPT-4仍存在一些局限：

•知识截止：训练数据截止到2021年9月
•推理错误：在复杂推理中仍可能犯错
•偏见问题：训练数据中的偏见可能影响输出

GPT-4代表了AI发展的重要里程碑，为未来的AI应用开辟了新的可能性。