本小章还未完,请点击下一页继续阅读后面精彩内容!
2020 年,幻方累计投资超亿元、占地面积相当于一个篮球场的 AI 超级计算机 “萤火一号” 正式投入运作,进一步提升了幻方量化的核心竞争力。2021 年,梁文峰团队研发 “萤火二号” 的投入增加到 10 亿元,搭载了约 1 万张英伟达 A100 显卡。同年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的 “四大天王” 之列。梁文峰在量化投资领域的成功,不仅证明了他在技术与金融融合方面的卓越能力,也为中国量化投资行业的发展树立了新的标杆,引领了行业的创新发展潮流。
通用人工智能领域的创新突破
在量化投资领域取得巨大成功后,梁文峰并没有满足于现状,他的目光再次投向了更具挑战性和前瞻性的领域 —— 通用人工智能(AGI)。2023 年 5 月,梁文峰宣布进军通用人工智能领域,7 月,他正式创办杭州深度求索人工智能基础技术研究有限公司(DeepSeek),专注于 AI 大模型的研究和开发。
2024 年 5 月,DeepSeek 发布混合专家语言模型 DeepSeek-V2,并宣布 DeepSeek-V2 的推理成本被降到每百万 token 仅 1 块钱,约等于 GPT-4 Turbo 的七十分之一。这一极具性价比的模型架构一经推出,便在业界引发了轰动,国内排名靠前的大模型纷纷跟进降低成本,DeepSeek 也因此被称为 “AI 界的拼多多”。同年 12 月 26 日,DeepSeek 宣布上线并同步开源的 DeepSeek-V3 模型,并公布了长达 53 页的训练和技术细节。模型测算数据显示,DeepSeek-V3 虽然文字生成类任务较弱,但其代码、逻辑推理和数学推理能力均名列前茅。在 DeepSeek 研究团队同步公开的技术论文中,一个细节引发广泛关注:DeepSeek-V3 整个训练过程仅用了不到 280 万个 GPU 小时,按每 GPU 小时 2 美元计算,模型全部训练成本仅为 557.6 万美元(约 4000 万元人民币),这一成本几乎是 GPT-4o 训练成本的二十分之一。DeepSeek-V3 的成功,再次彰显了梁文峰及其团队在技术创新方面的强大实力,以极低的成本实现了高性能的模型训练,为中国通用人工智能的发展注入了一剂强心针。
2025 年 1 月 20 日晚,DeepSeek 正式发布 DeepSeek-R1,该模型在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。此外,DeepSeek 同步开源模型权重,并表示将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。这一举措不仅展现了梁文峰对技术发展的开放态度,也为全球人工智能领域的发展贡献了中国智慧和力量。随着 DeepSeek 的全球 “爆火”,梁文峰表示,中国 AI 不可能永远处在跟随的位置,“我们经常说中国 AI 和美国有一两年差距,但真实的 gap 是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。” 梁文峰在通用人工智能领域的创新突破,不仅推动了中国 AI 技术的快速发展,也在全球范围内产生了深远的影响,让世界看到了中国在人工智能领域的无限潜力。
社会活动:肩负责任与使命的担当
为行业发展建言献策
作为量化投资和通用人工智能领域的领军人物,梁文峰积极参与各类行业交流活动,为行业的发展建言献策。他多次参加国内外重要的金融科技和人工智能学术会议、行业论坛等,在这些场合中,他分享自己的实践经验和前沿思考,与同行们共同探讨行业发展的趋势和面临的挑战。
在一些金融科技会议上,他针对量化投资行业的规范发展、技术创新以及人才培养等问题提出了许多建设性的意见。他强调,量化投资行业要注重技术与合规的平衡,在不断创新的同时,要严格遵守相关法律法规,保障投资者的合法权益。同时,他也呼吁行业内加强人才培养和引进,提高整个行业的专业素质和创新能力。
在人工智能领域的论坛上,他围绕通用人工智能的发展路径、伦理道德以及国际合作等话题发表了深刻的见解。他认为,通用人工智能的发展具有巨大的潜力,但也面临着诸多伦理和社会问题,需要全行业共同努力,制定合理的规范和准则