slug
type
status
date
tags
summary
category
icon
password
“从商科到大模型”:Lena 学姐的学术、职业与人生选择
受访者:Lena

主持人:Felix(悉尼大学中国学联)
Lena,悉尼大学商学院一等荣誉学士,全奖直博,目前博三在读,研究方向为人工智能与生成模型。同时,她也曾是字节跳动的算法工程师,曾担任 QBUS2310、QBUS2810、QBUS6850 等多门课程的导师,并在 QBUS3830 与 ELEC5304 担任客座讲师,并发表包含人工智能顶会在内的国际会议/期刊14篇。
本次访谈围绕「学术与研究」「职业发展」「教学与学术平衡」「个人与未来」「择偶与学历」五个维度展开,以下为经整理后的文字实录。
一、学术与研究:从商学院走向人工智能
1. 商学院的经历如何影响你走向 AI?
Lena 认为,商学院最大的特点是开放与多样性。
在本科阶段,商学院允许学生:
- 选择非商科专业作为 major 或 minor;
- 在商科学习中选修统计、数学等跨学科课程,拓展视野。
以她自己的商业分析(Business Analytics)专业为例,课程不仅包括传统的商业数据分析,也涵盖了大量统计学、数学与基础机器学习,为后续转向人工智能打下了扎实基础。
她笑称:
“商学院看起来跟 AI 很不相关,但正是它的包容性和开放性,让路没有越走越窄,反而帮我保留了‘往别的方向跑’的可能。”
正是这些基础课程与广度学习,让她在之后选择人工智能时,有了足够的“起跳板”。
2. 博三阶段的研究方向与成果
目前 Lena 主要聚焦两个方向:
- 大语言模型(LLM)相关研究
- 与 TikTok 合作,做大模型应用相关的数据 pipeline;
- 与其他高校合作,研究大模型训练中的 RL 效率与加速问题。
- AI for Science(用 AI 解决科学问题)
- 重点放在物理、医学等领域;
- 最近的项目包括用模型求解 PDE / ODE、随机微分方程等传统而“硬核”的科学问题;
- 这一块目前与主流 LLM 架构联系不算特别紧密,更多还是偏传统机器学习与数值方法的结合。
在成果上,她和她的合作者近年在国际顶级会议上陆续发表了多篇论文,包括 ICLR 与 NeurIPS 等顶会。
3. 做大模型/生成模型时最大的挑战是什么?如何克服?
Lena 提到,最大的挑战其实有两个:算力和数据。
① 算力资源的瓶颈
- 商学院自己没有 GPU 资源,只能和学校的 HPC 平台(如 Artemis)共用,但环境复杂、使用体验一般;
- 早期她读硕的时候,只能做一些算力要求较小的模型;
- 到了大模型时代,自己买的几张卡“完全不够看”,根本扛不起 70B 级别的模型。
解决方式主要是:
“靠合作换算力。”
也就是:
- 自己这边负责 idea、理论推导和主要 coding;
- 与有算力的大组、公司合作,在他们的平台上完成大规模训练。
② 理论与实践:大模型的“薄理论”和数据问题
在理论上,她认为:
- 大模型本身的理论基础相对薄弱,某种程度上是“大力出奇迹”;
- 反而像 diffusion 这类生成模型,与能量模型、flow matching 等传统理论连接更紧。
真正麻烦的是数据:
- 学术研究中,很多 benchmark 数据集已经被“反复用烂”,质量参差不齐;
- 在工业界,大公司可以掌握大量高价值的私有数据,但学术界往往接触不到;
- 即便使用 API,不自己买算力,也会面临更高的成本压力——算账同样很现实。
她的应对思路是:
“如果是做学术,就用被大量使用、经验证的数据集,把经验当成筛选标准;如果是做应用,就一定要跟该领域真正懂业务的人合作,让他们来帮忙定义:什么数据是可信的、最有价值的。在 ‘Intelligence’ 之前,我们得先搞清楚 ‘Artificial’ 从哪里来。”
二、职业发展:从“野路子”到“正规军”
4. 从学术到企业:为什么会选择去字节跳动?
Lena 在博二时经历过一段迷茫期:
- 一方面,算力严重受限,她自费买显卡但依然远远不够;
- 另一方面,当时做的 GNN 方向应用面比较窄、算力消耗大,她很难看清这个方向未来的价值;
- 再加上投 NeurIPS 的尝试不如预期,她感觉自己“在一个死胡同里打转”。
在这种困境下,她决定“先跳出去再说”:
- 偶然刷到 TikTok 的算法岗招聘;
- 又刚好认识公司内部的人,于是去要了内推;
- 凭着“有点懵懂的勇气”,在算法面试基础都不太扎实的情况下,硬着头皮上,最后真的拿到了实习机会。
她回头看这段经历时说:
“很多时候,突破困境不一定是等到一个‘万无一失’的方案才出手,而是你先勇敢迈出那一步,然后再一边走一边把路踩实。”
从进公司那一刻起,她感觉很多事情开始发生变化——包括眼界、氛围、做事方式。
5. 学术 vs 工业:最大的差异在哪里?怎么适应?
她总结了几个很典型的差异:
(1)数据:从干净 benchmark 到“惊喜 + 惊吓”
- 学术里的数据集:干净、规整、有完善文档和现成的 split;
- 工业界的数据:脏、缺标签、充满各种异常情况。
“在学术里,我们大概知道 ‘应该期待什么’;在工业里,你会发现每天都有你从来没想到的问题。”
(2)方法:新不新 vs 好不好用
- 做学术时,大家追求的是 novelty、SOTA、贡献点;
- 工业里,很多“吹得天花乱坠的新方法”可能并不好用,反而是稳定、简单的 baseline 更可靠;
- 同时,团队与上级会有业绩、亮点的期待,需要“前沿”和“可落地效果”之间不断平衡。
(3)问题复杂度:从“一道题”到“十道互相打架的题”
在学校里,我们想的是:
“这个 research question 的答案是什么?”
但实际业务场景是:
- 一个问题牵出十个问题;
- 技术、产品、成本、组织结构、KPI 之间全都要考虑;
- 很多问题之间还互相冲突,不可能全都兼顾。
她应对这些差异的核心方法有三点:
- 先用“学术模式”当 baseline,对比哪里不同;
- 在公司里多问 mentor 和同事,了解历史做法,用经验补足认知;
- 在缺乏前人经验时,用“第一性原理”拆解问题,回到本质重新设计方案。
6. 在字节做算法工程师:最喜欢和最具挑战的部分
最喜欢的部分:
- 充足的算力
- 公司在悉尼的算力资源充沛;
- 70B 级别模型可以真正跑起来,不再被算力捆住手脚。
- 和一群非常聪明的人一起工作
- 团队成员来自国内名校和海外优秀高校的博士;
- 在这样的环境里,自己的不足很容易被照亮、被纠正;
- 也可以不断吸收不同人的思维方式与做事习惯。
“一个人再聪明,视野和时间都是有限的。把很多聪明人放在一起,就能迅速暴露问题,也能更快迭代解决方案。”
最具挑战的部分:
对她而言,技术本身反而不是最大难点,真正挑战在于:
- 如何在团队中说服别人接受自己的方案;
- 如何用一个扎实的 story 告诉大家:
- 为什么要这么做?
- 为什么这是当前条件下最合适的方案?
- 为什么其他看起来“也不错”的方法不选?
她认为,这一点甚至比单纯“把模型调到最好”更难,也是一种全新的能力训练。
7. 她眼中的 AI 突破与未来趋势
Lena 不太愿意给出“最大的突破”这种武断结论,她更愿意谈自己看好的方向,例如:
- 大模型的 Memory / 模块化能力
- 通过类似 “记忆模块” 的方式,让模型能在不同任务之间插拔;
- 像在人脑里“插一块记忆卡”:插上某个模块,就具备一项新能力,拔掉就忘记;
- 技术上可以通过 LoRA 等方式实现,更强调灵活性与可扩展性。
- 长上下文处理(Long Context)能力
- 让模型在处理长文档、复杂推理时更加稳定和高效;
- 对真实应用场景意义重大。
至于“AI 的终局趋势”,她保持克制和谦逊:
“这种问题可能更适合交给马斯克和奥特曼在峰会上畅想。对我来说,我更关心的是:AI 能不能真正进入我们的 everyday life,成为一种可靠的辅助,而不是替代人类。”
她希望看到的是:AI 深入医疗、工厂、日常生活,成为生产和生活的“加速器”,而不是让人失去主体性。
三、教学与学术平衡:在“讲台”和“论文”之间
8. 如何平衡教学(担任Tutor)与科研?在教学中最看重学生什么能力?
在平衡上:
- 博一那年,她给自己排得很满:一周七天、几乎不休息;
- 大致安排是:约 5 天做研究,2 天投入教学;
- 随着课越上越熟,备课成本降低,教学变得更像“自动驾驶”;
- 当发现自己在教学上已经难以再突破、嗓子也因高强度讲课受损后,她选择逐渐退出这部分,把精力投入到新的探索中。
她在学生身上最看重的能力有两类:
- 从“老师视角”能直接观察到的:
- 持之以恒:
- 基本学习习惯与自律,是一个不错学生的“及格线”。
能 13 周里来上 10 周以上的课,认真听讲、记笔记、按时完成作业的学生,已经是非常少数;
- 从“学生视角”更本质的能力:
- 归纳总结能力;
- 发散思考能力;
- 团队协作能力;
- 更重要的是——知道自己要什么。
“不论是上课、做项目还是规划职业,最重要的是:你清楚自己希望从这件事中得到什么,并且愿意为此持续行动。”
9. 最喜欢和学生聊什么?
严格来说,Lena 并不是那种在课堂里频繁聊人生、聊八卦的老师。
平时学生最常找她讨论的,其实是:
“老师,这题我为什么扣分了?”
但在她更熟悉、也更热爱的话题——例如机器学习——上,她会在课程最后、尤其是期末阶段,多聊一点“课本之外”的内容,例如:
- 这个模型在工业界是怎么真正被用起来的;
- 当前这个方向的研究前沿大致走到哪里了;
- 如果学生未来想在这个领域深挖,可以往哪些方向看。
她坦言,大多数学生其实未必那么关心这些,但她仍然愿意适度“打开一扇窗”,让真正感兴趣的人知道:课本只是起点,不是终点。
四、个人与未来:压力、时间与选择
10. 博士 + 算法工程师,压力大吗?如何管理时间?
她的回答有点出乎意料:
“我其实不太觉得自己压力很大,而且还挺闲的。”
这并不是因为她不忙,而是:
- 博士研究与算法实习在她这里是高度融合的:
- 公司知道博士有论文需求,会为研究留出空间;
- 不会抢一作、通讯作者等学术资源;
- 对她来说,“工作”和“研究”并不是两件互相抢时间的事,而是同一件事的不同面向。
她更在意的,不是“时间管理”,而是预期管理(alignment):
- 什么时候我们会觉得时间不够?
当 A 让我们做这件事、B 让我们做那件事、自己又想做第三件事时。
- 如果能让导师、公司 mentor 和自己三方的预期尽量对齐,比如:
- 这个公司项目能否演化成一篇论文?
- 工作投入的时间和学术产出是否匹配?
- 自己这一年最核心的“主线任务”是什么?
那么很多“时间冲突”,会自然收敛成“一件事”。
11. 对未来职业规划的看法:学界 vs 工业界?
Lena 坦白说,她现在仍在探索中,没有给自己画一个“非走不可的轨道”。
她的思路是分两层看的:
- 长期层面:更在意“人生平衡点”
- 她希望未来能在事业、家庭、时间与经济支持之间找到一个平衡点;
- 不只是问“我到底要做学术还是进公司?”,而是:
“在某个阶段,我和家人都能有足够的自由,去做自己想做的事情。”
- 短期层面:聚焦阶段目标
- 去年,她的短期目标是:“搞清楚算法工程师这份工作的运转方式和部门的运行机制”;
- 最近,她开始额外关注量化方向,为自己打开另一种可能;
- 学术与工业目前依然保持一种平衡与互相促进的关系。
她承认这听起来有点“玄学”,但也是出于一种现实的清醒:
“世界太混沌了,时间拉得太长时,任何规划都不稳定。我能做的是:把当下阶段能做好的事做到最好,然后给未来留一点空位,让机遇来决定拐点。”
五、择偶与学历:关于契合度、标准与“抓大放小”
12. 如何看待“伴侣选择”这件事?(Lena学姐与她老公已经相识7年)
在她看来,择偶中最核心的关键词是:契合度。
- 契合度并不能用单一、统一的世俗标准来衡量;
- 每个人真正在意的点都不一样——有人看重事业、有人看重家庭、有人看重情绪价值;
- 契合的本质,是:在一起时,我是不是舒服、开心的?
以她和丈夫为例:
- 她更偏事业型,时间和精力很多投在工作和研究上;
- 丈夫则更愿意承担家庭中的琐碎事务,给她提供稳固的后方支持;
- 有人笑称她“选男人的思路和传统意义上男人选老婆的思路是一样的”:她也觉得挺准确——她是“主外”的那一方,需要一个愿意“主内”的伙伴。
对于“深造是否会增加择偶难度”,她的态度是:
“我当年认识他时才十九、二十岁,其实完全没想那么远。只是觉得这个人相处很舒服,那就先试试看,不行就算了——结果就一路走到了现在。”
她不倾向于在一段关系发生之前,就给自己加很多“算计式的焦虑”。
13. 学历在择偶中重要吗?
她的看法是:
“学历不是决定性因素,但有一个隐性的影响。”
- 高学历与否,本身不应该变成一套僵化的筛选条件;
- 但不同的人生轨迹(例如一路读博 vs 很早进入社会)确实会塑造不同的价值观、思维方式;
- 如果两个人的人生轨迹差距过大,三观和思维方式的差异会被放大,契合度自然会下降。
所以她并不赞成用“学历门槛”一刀切地筛人:
“如果一上来就拿一堆条件——身高、学历、年薪、家庭背景——去‘筛简历’,很可能把真正适合自己的那个人筛出去了。”
她更建议:
- 先认识真实的人,再看他当下形成的三观与生活方式是否和自己匹配;
- 至于这些三观和习惯是如何形成的,没必要像心理医生一样往回推太多。
14. 给“高学历但很难找到伴侣”的年轻人的建议
对这类群体,她提供了两个关键词:抓大放小 和 向内总结。
(1)抓大放小:先想好“决不能妥协的点”
- 每个人真正“绝对不能妥协的点”其实不会太多,最多一两个;
- 例如:是否愿意共同承担家庭责任、是否能尊重对方的事业选择;
- 把这些核心原则挑出来,其他条件(比如身高差两厘米、有没有 six-pack 等)就可以适当放松。
她举了一个例子:
“你口头上说‘我一定要 180 以上’,但如果对方 178、穿上鞋、头发再蓬松一点,其实谁也看不出来。这个就明显是可以放下的小条件。”
(2)从过往经历中总结“自己真正要什么”
- 对于很多高学历年轻人来说,过去往往不是“完全没有过感情经历”,而是经历过几段不太合适的关系;
- 与其靠想象列一个完美的择偶清单,不如回头看看:
- 在之前的关系中,哪些点让自己非常在意、最后无法接受?
- 哪些优点是自己当时特别珍惜的?
Lena 自己就是这样做的:
- 在上一段感情中,她意识到有一些点与自己的生活方式不契合;
- 在下一段关系中,她有意识地避免这些“雷区”,结果契合度自然高了很多。
结语
从商学院到大模型,从“野路子”到“正规军”,从科研到工业,再到对人生与伴侣的选择,Lena 的故事里有非常多现实的矛盾,也有很多务实而清醒的取舍。
她没有给出一条“标准答案式”的人生路线图,但反复强调了几个贯穿始终的底层原则:
- 保持对自己真正想要什么的清晰认知;
- 在困境中,先勇敢迈出那一步,再在路上把问题解决;
- 让预期对齐,让时间聚焦在最有价值的事情上;
- 在职业与情感中,学会抓大放小,找到对自己真正重要的少数几个点。
这些,或许就是她想留给正在成长道路上的悉大同学们的一些“经验之谈”。
感谢 Lena 学姐的分享,祝大家在学术、职业与人生选择中都能找到属于自己的答案。
- Author:盛溪
- URL:https://tangly1024.com/article/%E2%80%9C%E4%BB%8E%E5%95%86%E7%A7%91%E5%88%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B%E2%80%9D%EF%BC%9ALena%20%E5%AD%A6%E5%A7%90%E7%9A%84%E5%AD%A6%E6%9C%AF%E3%80%81%E8%81%8C%E4%B8%9A%E4%B8%8E%E4%BA%BA%E7%94%9F%E9%80%89%E6%8B%A9
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
Relate Posts

.jpg?table=block&id=26f7c1d5-a1e9-80d7-a52b-e71bb7079501&t=26f7c1d5-a1e9-80d7-a52b-e71bb7079501)


