
6月8日下午,2025年大学入学考试英语学科考试结束了。在今年的英语北京论文的大学评论作品中,李华再次成为“主角”。同时,“语言能力测试”已成为大型AI模型的试金石 - 从准确的问题分析到真正的表达,从逻辑连贯性到文化适应,是否可以使用大型语言模型来完成英国成分入口的独特大学要求?在所有大型模型已经具有“深思熟虑”模型的时候,“ AI候选人”可以得到多少要点?在这方面,北京新闻Beike Finance回顾了国内外的主要语言模型。该评论选择了2025年大学入学考试英语北京纸质主题。目标评论是DeepSeek R1,Chatgpt O3,Tongyi Qianwen Qwen3,Tencent Hunyuan T1,Iflytek Xinghuo X1和Baidu Wenxin X1。他们还邀请了北京11号学校的英语老师韩昌和深圳中学的英语老师赵文贾(Zhao Wenjia)对近年来在疏散标准中基于上述大型模型产生的大型模型生成的英语作品进行评分和评论。根据目的和公平和“盲目分析”的原则,老师Han Xianchang和老师Zhao Wenjia给出了专业评级。参加这项比赛的六个大型“ AI候选人”的数十大型“ AI候选者”之后,排名是:Iflytek X1,DeepSeek R1,Baidu Wenxin X1,Tongyi Qianwen Qwen3,Chatgpt O3,Tencent Hunyuan T1。特别是,2025年大学入学考试英语北京论文组成主题的要求是:假设您是李华(Li Hua),这是一所高中高中,可在洪恩克斯(Hongxing)中学学习。联合国正在为世界各地的年轻人发起倡议道歉。你的fOreign的朋友吉姆(Jim)的目标是参加,并发送电子邮件询问您有关该提案的建议。请用英语回应他,包括:1。提出的建议; 2。建议的因素。提示词:建议提案注:1。单词数几乎为100; 2。给出开始和结束,单词总数不包括。 Mahal Jim, ___________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________Active!对于您的提议,我建议专注于在全球范围内没有塑料的情况下促进校园。我的建议是鼓励学生通过携带可用的瓶子和袋子,回收塑料废物来减少单个塑料,并修复整个学校的意识运动。我推荐这个原因有两个。首先,塑料污染是损害野生动植物和生态系统的全球危机。作为微社区的学校可以提前采用环保习惯来推动真正的变化。其次,年轻人和社会的集体行动。当地的开始产生了影响涟漪 - 增强了我们这一代保护地球的力量。该建议不仅将处理紧急问题,而且还将处理边界学生的单位。我相信它是实用的,影响了联合国的目标 - 我为您扎根!您,李华老师汉昌评分:7个内容点,8个语言点,结构中的4分→总分19分评论:内容是详细的,建议“统一的校园”是特定的主题,原因是全面的(环境和青年表演),以及高度相关的主题。准确的语言,丰富的句子E结构(复合句子),没有错误。结构很紧,逻辑是光滑的,末端很强。但是,显然会扣除超出单词限制和1分的范围。老师Zhao Wenjia得分:19分评论:该模型的内容都提到了上述所有点,并补充了细节;该语言习惯于将当前分词用作附件后,介词短语作为副词等。结构很紧,逻辑平滑。但是,联合国倡议的翻译不够具体,实际测试可能无法完成。 CHATGPT O3亲爱的吉姆,我建议您建议一个名为“零塑料午餐盒”的项目。这个想法是鼓励中学用可用的不锈钢容器替换一次性包装包装。参与者的学生在共享应用程序中记录了塑料的减少,并发布了每周切割垃圾的提示。它有效的原因。首先,塑料废物是对海洋生物的主要威胁,但青少年可以通过简单的午餐时间习惯来阻碍它。其次,应用程序数据将通过显示清晰的环境优势和世界的可扩展性来给联合国面板留下深刻的印象。有语言错误(例如“起作用”俗语化),句子结构没有变化。结构通常很清楚,但是发展还不够。老师Zhao Wenjia得分:15分评论:一开始有背景缺陷,联合国倡议收集活动有些艰难,并且该结构缺乏期望的祝福。一些单词选择不准确,其表达不完整。原因还不够深。 tongyi qianwen qwen3 deAR Jim,我很高兴听到您对联合国Sal Pampoka运动的兴趣。我建议“促进农村青年的数字素养”。偏远地区的许多年轻人无法获得技术教育质量,从而限制了他们的未来机会。您的建议可能要求在胡说八道中提供全球合作伙伴关系,以提供访问设备,在线课程和教师培训。这符合联合国的可持续发展目标,并使年轻人有能力弥合数字部门。作为学生,您可以分享个人故事,以突出技术技能的变化。我敢肯定,这个想法反映了联合国,并显示了由青年驱动的解决方案,7个语言点,结构中的4分→总计17分评论:内容通常是完整的,建议“农村数字素养”是合理的,但原因稍微简单(效果并不完全扩展)。语言是准确的,句子结构很简单,表达式是适当的。清除s电源和自然连接。老师Zhao Wenjia得分:17分评论:由于缺乏连接词,结构和逻辑略低。 Tencent Hunyuan T1亲爱的Jim,很高兴听到您正在提出联合国青年建议。这是我的想法:专注于“绿色园区倡议”。青少年是塑造可持续未来的关键,而学校是我们大部分时间的时间。娱乐类似于生态行动的回收竞赛,节能挑战或植物天 - 树木罐头是一个很大的变化实践。这些活动很容易解决,并教会了我们责任。年轻人正在推动真正的-world.hope可以帮助您聆听自己的最终计划 - 吉姆(Jim)! “很高兴听到”),句子的简单结构和体面的弱。结构松动和随机整理。 Zhao Wenjia得分老师:14分评论:结构还不够清楚,缺乏连接词,原因不丰富且足够深。 iflytek spark x1亲爱的吉姆,我很高兴他LP您的建议!我建议建议建立“全球青年气候行动网络”。该计划将与世界各地的青少年建立联系,以共享环保项目,例如学校回收计划或社区种植,并与气候问题解决方案合作。 原因是两次:首先,它使年轻人在传播意识的同时采取实际措施来解决环境问题。其次,结合一个平台下的多样性玻璃植物在塑造可持续发展方面具有年轻作用,这与联合国的目标完全一致。 让我知道您是否需要更多详细信息! 对您来说,李华汉江等级:内容8点,语言8分,结构4分→总分20分回顾:完整内容,建议“全球气候行动行动网络”很明显,原因是足够的,并且非常遵循主题。语言通常是准确的,句子结构会有所不同(例如“双重”结构)。结构很清晰,经文是自然联系的。老师Zhao Wenjia得分:19分评论:在回顾问题时,对问题进行了准确的理解,并记录了主要内容点并给出了深刻的解释。有许多具有不同语言形式的句法结构。从结构上讲,第一段等于第二段。通常,如果采用了结构,则初始信息的中间段落主要可以按长度和内容来亮点。 Baidu Wenxin X1亲爱的吉姆,我很高兴知道您正在参加联合国提案集合。我的建议是专注于“”促进传统作品的“数字变化”的“”“首先,由于全球化,许多古老的手工艺品都缺失了。通过合并3D或VR建模等数字工具,青少年可以帮助艺术家维护程序并吸引更多的受众。其次,该提案与维护 - 重制的当地作品相一致,减少了工业废物,并支持环保人ufacture。最后,它引起了文化的交流,作为一个可以在这些作品背后分享故事的年轻人的世界,从而增强了彼此的理解。相信AI已经平衡了联合国关心的创造力,文化关怀和技术互动的想法。让我知道您是否需要更多详细信息!您,Li Hua老师Han Xianchang分数:7个内容点,8个语言点,结构中的4分→总分19分评论:内容更改,详细建议在“数字手工艺保护”中推荐,原因是足够的(文化维护)。出色的语言,不同的句子(例如“首先...最后”),没有错误。合理的结构和平稳的过渡。 Zhao Wenjia得分老师:18分评论:结构清晰有能力,这些因素足够且具体,并且单词和语法的选择是准确而多样的。在对两位老师提供的平均分数分类后,六个大型模型的排名是S下列:关于上述AI模型,Han Xianchang先生说,他们都可以在内容上达到关键点并完成写作任务。但是,内容细节,细节之间逻辑关系的强度,表达意见的准确性和简单性之间存在显着差异。老师Zhao Wenjia说,某些模型的组成在语法,语法和单词选择方面非常准确,准确,并且显然具有逻辑以及足够和深层的因素。相比之下,某些模型的组成不太合乎逻辑,尚未完全开发。汉老师告诉北京新闻贝克金融记者,这些AI生成的作品的想法具有相当的创新性,因为AI模型在短时间内具有更好的搜索和集成功能,可用于大量信息。真正的候选人很难在有限的时间内具有特别创新的观点。他们通常会寻找稳定并采用保守的观点,以及当天训练的相关主题(日至今的生活)被移至评论室。在赵老师的观点中,AI一代人AI的上述组成的特征是,单词的选择非常先进且相对准确,并且可以合理地使用各种词汇来表达它。某些语法(例如非预测的动词和条款特征)在应用中众所周知。内容更深,更具体。它们与真实候选人之间的区别主要在于单词选择的深度和内容的表达。但是,与对真正候选人的良好来源的学生相比,AI生成的组成句子仍然不够丰富且使用相对较好,例如分词,例如调整后,副词和特征性条款。此外,实际候选人也将由不同类型的颠倒,复合结构和独立使用基本的Gerund模式。 “就特定内容而言,AI模型中GEM的标记标准在写作方向上是不同的。作曲的某些内容非常简单,而其他内容则太简单了。这与大型模型中的数据库有很大关系。”汉老师说。值得注意的是,上述的“ AI候选人”都是对心灵深思熟虑的监护模式。在今年的春季音乐节期间,Deptseek公司的受欢迎程度,Kuthe的主要大型模特正在关注急诊模型。 5月28日,DeepSeek更新了DeepSeek-R1-0528版本; 5月21日,Tenyuan T1和Kuanishou对Hunyuan Turbo的深刻想法都迭代了。主流模型已在推理层面上进行了更新,这也带来了其英语写作能力和其他方面的改进