过去的半年里,社会环境发生了不小的变化。伴随着新型冠状病毒感染疫情[1]的结束,我们终于可以摘下口罩,回归生活的正轨。另一方面,生成式语言模型的发展也给各行各业和人们的生活带来了改变。
经过四年的大学生活,我总算走到了本科毕业,准备迎接未来(预计)五年的直博生涯。
站在这个承前启后的时间节点,回顾过去一个学期,我在此记录一些令自己印象深刻的事。
人工智能
互联网上有很多关于 AI 的讨论。我本不想落入俗套地赘述一些平平无奇的内容,但 AI 的影响力实在是太大了。所以,我不妨写一些自己与 AI 发生的比较独特的经历。
寒假里,我加入某公司某团队,运用自己的系统能力和工程能力,帮他们开发一个 ChatGPT 的代理。正如 AI 行业的整体风格一样,这个团队的一大特点就是“急”:没日没夜地工作,经常半夜十二点前给我一批数据要我跑。事后看来,相比于 GitHub 上其他类似工作,我的成果质量并不算高,但应该也是为他们解决了一些燃眉之急吧。
在该项目中,我也有一些收获。技术层面,我第一次掌握了代码驱动浏览器的技术,并学到了 xvfb 之类虚拟屏幕的用法(参见 在容器中运行完整版 Chromium)。理念层面,我第一次实际接触了微服务、动态伸缩等理念,这也将应用于我未来的项目经历中。
还是得感叹一句,中国人真的很善于降本增效。
学期中,我加入了清华大学学生人工智能基础架构协会。我一开始以为这个协会吸引的主体是人智所的同学,没想到高性能所的同学也占了一半。但我这个搞存储软件的还是显得格格不入(x 我加入协会的原始目的其实是为了满足某些情感诉求,即人们仿佛只关心 AI 的各种花里胡哨的应用,却忽视支撑着 AI 的底层系统。所以,我还是很想通过加入协会了解存储系统在 AI 领域里的一席之地。
最后,关于我的研究领域与 AI 关系的问题,我目前的核心理念是,让系统成为 AI 的基础而非本末倒置。希望五年以后我仍然这么想。
当然,不用 IDE 是不可能的(x
这张图怎么放到博客里这么大。。。
音乐艺术
这学期,我选修了《交响音乐赏析》,受益匪浅。这门课给我最宏观的收获是,要用历史的眼光看音乐流派,任何音乐流派的发展都离不开其历史、政治和社会的背景。此外,这门课也在一定程度上提升了我对音乐艺术的鉴赏能力。
平日里,我更喜欢听纯音乐,而对流行音乐不感兴趣。我更容易受旋律和配器本身推动个人情绪。话虽如此,但我对音乐的偏好仍未脱离大众的俗套。我经常被音乐创作者的雕虫小技吸引,喜欢一些技巧性的旋律[2]、新奇的乐器[3]和层次丰富的声部[2][4][5],尽管我知道有些就是作者设计出来满足听众喜好的。此外,套用《交响音乐赏析》老师的说法,这类技巧和设计也是前人早已用过的,从音乐艺术的角度并无创新性。再比如,我欣赏的所谓层次丰富的旋律,和复调的艺术比起来差远了。不过呢,日常听歌还是自己高兴就好。
在将来,我也许会入门一门乐器。但感觉不知道有没有时间(
系统思维
我接下来五年要从事系统方向的科研工作。这学期我对“系统思维”有了粗浅的认识。
系统思维不单局限于某一种系统,而是关心系统的研究方法。以我本科毕设选题为例。最开始的选题是,针对图数据库邻边扫描的场景,设计一种缓存机制来提升查询效率。后来 为了多凑点页数,章老师指导我将选题的重心调整为我们设计的缓存机制,将图数据库作为该缓存机制的一个上层应用,并新增分布式文件系统作为该缓存机制的另一个上层应用。这样,文章提出的缓存机制就能被视为一种通用的机制,而非为了某一种应用专门设计的产物。这就是系统思维的体现。
再比如,我大三在另一个课题组参与的一项实习工作,利用一种新型分布式训练方法优化大模型训练性能。这项工作的不足之处在于,它好像是为不同的算子和不同的模型分别设计的算法的集合,却没有从系统的层面加以统一,因此不符合系统研究的气质。
当然,我现在对所谓“系统思维”的理解相当肤浅。今后的研究工作还是需要更广阔的视野,需要多思考、多理解。
说到底,我现在理解的所谓“系统思维”依然没有脱离“树状思维”的范畴。Xyi 总是劝我不要局限于“树状思维”,但计算机学科就是高度层次化的,那可如何是好呢?
汉语方言
上学期,我选修了《昆曲艺术欣赏》,沉浸式体验了吴语(太湖片)。
这学期,由于一些别的契机[6],我对方言产生了一定的兴趣。考虑到我将来可能在吴语区定居等原因,我打算学习一些吴语的基本知识,争取首先做到能听懂。
我选用的学习资料是 【苏白学堂/教程】吴语苏州话语音基础入门(学堂版拼音),辅以 吴语学堂 作为电子字典,准备先学习一些基础的发音。虽然由于后半学期空闲时间较少,我只学了几个简单的韵母,但也对吴语取得了初步的认识。
吴语的语音相对复杂,有 27 个声母、49 个韵母、8 个声调[7]。这源于吴语的一些相对独特的语言特点:区分清音浊音、区分尖音团音、声调分阴阳、保留入声。
此外,同一个声调在不同地区、不同县市的发音都有区别。(老上海貌似根据发音腔调就能判断你是哪个地区的人。)吴语又有复杂的连读变调机制(且无固定规律),不同地区的连读变调方式又有很大的差别,这更增添了吴语的复杂性。
考虑到我连吴语的基本发音都没有学明白,在这里就不多加介绍了。
江苏不愧是“苏联”,一个省内就能齐聚吴语、江淮官话、中原官话三种截然不同的方言。
我的本科
本年度,我忝获谭浩强教育基金优秀学生奖。我写的自我陈述大抵概括了我本科的经历,遂摘录于此:
自我陈述
- 积极推广计算机教育,参与答疑坊、基础技能培训等多项计算机教育普及工作,参与编写《技能引导文档》,曾担任《软件工程》课程助教、《面向对象的程序设计基础》课程小教员。
- 积极组织计算机赛事,主办智能体大赛,并负责维护智能体比赛平台 Saiblo,为平台的功能改进、性能优化、运维传承与管理规范化做出了突出贡献。
- 积极参与计算机比赛,在全国大学生计算机系统能力大赛中,所在队伍获得操作系统设计赛功能设计赛道一等奖。
- 积极参与开源社区工作,为 TypeScript、React Native 等社区提出了一系列议题和拉取请求;负责维护 convert-excel-to-json、posix 等 npm 包的类型标注;推进 Saiblo 平台工具链开源,优化智能体大赛参赛体验。
- 积极推进校园信息化建设,以学生身份开发的信息门户移动端应用深受同学好评,为同学们的信息化生活带来了便利。
这些经历中,我最得意的还是 THU Info 和 Saiblo。THU Info 自不必说,我是创始人。至于 Saiblo 项目,我则是作为第二代开发者,参与维护并写了一些新代码。我希望我在 Saiblo 团队的参与将 Saiblo 平台带上一个新的高度。我将自己的主要贡献概括如下:
- 推进 Saiblo 平台架构改良,将评测端与网站解耦,形成一个纯[8]的模块;
- 使用
现代十年前的软件工程技术(Docker)简化评测机部署流程; - 优化评测机性能,减少因裁判调度引入的等待时间。
感觉我遗漏了不少贡献,
谁叫 ISFJ 型人格总是对自己的成就轻描淡写呢(x
事后想来,我的这些贡献并没有为 Saiblo 平台带来突破性的改变。一方面,这些贡献大多处于引擎盖的下面,仅仅是提升了日常运维效率。另一方面,第 3 点只不过对等待延迟问题起到了缓解的作用;但我未能打破思维定式,需要采用一种全新的架构才能彻底解决等待延迟问题。
不过我希望,我的这些贡献至少能为未来的接班人铺平工作的道路。期待我的接班人能为 Saiblo 平台带来全新的面貌。
按照是否高考生、是否由兴趣驱动学习计算机来分类,我大概属于兴趣驱动的高考生一类,并且我认为我对计算机学科的兴趣源于计算机本身,而非计算机的行业价值或者对其他领域的作用。比如说,我对编写代码这件事本身就充满热情,就好比一些人对写作本身具有兴趣一样。可能在某些维度下,我的本科远远达不到全面发展。但在自己热爱的领域内做出一些微小的事业,难道不是一间令人满足的事情么?
回顾我的本科四年,我总体上是满意的。究其原因,套用入学后某次年级大会上某位老师的话,我找到了大学生活的“支点”。对于我来说,这个“支点”就是科协。在此,感谢科协提供的各类资源,也感谢科协为我提供了一个展示自我的舞台。
特别感谢 Xyi 的陪伴。三年来,我们相知相恋,感受着爱情的甜蜜与温馨。你为我缓解焦虑与压力,为我指点生活的迷津,为我带来幸福与喜悦。感谢你为我的生活添上甜蜜的一笔,让我们继续走下去吧。
感谢挚友 @Ashitemaru 的陪伴。你是我合作的好伙伴,是我寻求帮助时第一个想到的朋友。祝你在自己热爱的领域里收获喜悦与成就。
为什么这一节变成赛博致谢了啊(x
碎碎念
- Saiblo 和 THU Info APP 的接班人都得找外系同学了,
贵系怎么变成这样了 - 大二时不屑于好好学网原,大四了才意识到网原的重要性。
- 这学期,我每个月的月底两三天都会没啥事干,这是什么奇怪的新规律么?
- 1.我不喜欢具有时效性的简称和缩写。这也是我日常生活中很少用“阳了”等表述的原因。 ↩
- 2.【Animenz】声嘶力竭 - 家有女友 OP 钢琴改编 ↩
- 3.Climbing the Ginso Tree ↩
- 4.Autumn Romance ↩
- 5.【Animenz】游戏人生 零 - THERE IS A REASON 钢琴 ↩
- 6.清明回老家感觉父母讲方言(江淮官话淮扬片)的场景显著增多了。 ↩
- 7.部分地区部分声调发生了合并,可能不足 8 个声调。 ↩
- 8.类似于“纯函数”的概念。 ↩
本文链接:https://www.unidy.cn/articles/summary-4-2/