许是前一天下午睡觉摸鱼被周诗亦逮个正着,李洛今天一上午都在亦舟上蹿下跳,抓人开会请教技术问题。林语一直温温柔柔地回答着,让李洛很是满意。
李洛顺着笔记问道:“我不太理解的是,教育数据挖掘(educationaldata)和学习分析技术(learninganalytic)的主要区别在什么地方呢?两者不都是利用学习过程中产生的大量数据来分析反馈学习成果吗?”
李洛和涂世欣正挤在林语的卡座旁,各自抱着电脑做着会议记录。
林语的办公桌上整齐地叠放着各类书籍和论文资料。涂世括了计算机数据结构、算法、图论、离散数学、概率论和统计学、机器学习等等科目。桌子右上角边上还堆放着各种打印好的文献,用彩色标签分门别类地归档了。
涂世欣低下头,瞄了一眼自己靠放在桌角地,里头几份打印资料毫无章法地穿插在一起,一本随身背着英文原版《大空头》是李洛推荐的金融趣味科普读物,书角都磨破了,但是自己从来没能一口气读过十页以上。他突然对于自己能有这份工作倍觉珍惜,感激地瞧了李洛一眼。
林语笑了笑,解释:“你提到的这点,正是二者共通之处。至于区别,从研究方法上来说,学习分析技术更注重运用统计学手段主观地分析数据、人为做出推断,为传统教学方式配备了数据反馈作为支持;而教育数据挖掘强调自适应,会倾向于使用无监督或者半监督的机器学习算法。
“从应用角度来说,学习分析技术的主要目的是对学生的学习结果进行测验和监控,为教师提供更详细的学生数据,从而改进教学方法。而教育数据挖掘更注重学习行为和学习过程,意图对行为本身进行量化分析。如果你感兴趣可以去找一下卡耐基梅隆大学教授ryanbaker的论文,里面有相当详尽的对比。”
除了那教授的名字涂世欣没能听清楚,他飞速地把这几句话一字不差地敲在了电脑上。偶尔他打字的速度跟不上林语说话的节奏,林语还贴心地放慢语速,等了等他。
涂世欣敲完一段后,偷偷瞄了一眼李洛的屏幕,发现李洛只是简略地记了两行。
“学习分析技术(la):人为分析、主观、辅助教学手段。”
“教育数据挖掘(edm):自适应、无监督模型、行为数据挖掘。”
在最下面,李洛记下了“ryanbaker”的名字。涂世欣又快速把这位教授的名字补填在了自己笔记的空档里。
李洛好奇地问:“可不可以给我讲一个教育数据挖掘在行业里具体应用的例子呢?”
林语点头,“比方说,现在有一个选择题有四个选项,c是正确选项,其他都是错误的。传统的考试批改方式,老师会这么判断:如果学生选择了c,他对这个知识点的理解就是正确的;没有选择c,则判断学生还没有熟练掌握这个知识点。”
“嗯!”李洛睁着大眼睛十分感兴趣。
林语笑着继续说道:“考试排名依照答题结果来评分,无可厚非。但也许有的同学偶尔粗心,实际上扎实地学懂了这个概念,却手滑填写了b作为答案;也有同学只是运气很好,随机选了个c,恰好答对了。学习系统接下来该如何自适应调整个性化的学习路径,还是需要ai形成更深层次的判断。基于贝叶斯网络的学生知识点追踪模型,可以根据测试题前后其他习题之间的联系来推测学生是否真实掌握了这个知识点,从而尽量避免无效的学习时间,也尽量防止被遗漏的知识点。”
“哇,这么厉害?”另外二人异口同声地感叹道。李洛好奇地看了一眼实验室的方向,问道:“那我可以试一下吗?你们都有什么科目的测试题?”
涂世欣戳了戳李洛,“洛姐,时间有限,人家还有其他工作呢。”
“哦,对不起。”
林语笑着说:“欢迎你随时来实验室玩。其实我举的这个例子,已经是学术界二十多年前的研究成果了,不怎么前沿。今天早上周总还嫌弃我们……”
李洛已经跳到了一下个问题:“刚才你提到的贝叶斯知识追踪,实时调整学生学习路径,其实要优于gre、act这种考试测评体系,因为后者仅仅是基于单项回答结果,而不基于知识网络,对吗?”
这个问题提得不错,林语坐直了些,解释道:“你说得很对。gre、act只是根据学生每道题是否回答正确,从题库中调出相应难度的题。而我刚才所说的,能够综合整体知识图谱,推荐优化的学习任务。”
“明白了。”李洛点头,“还有一个问题。之前也讨论过图形编程工具的专利收购的事宜,所以我想再跟进一下公司本身各部门的知识产权保护情况。这几个月来,有没有发生什么变动?算法技术方面,专利管理还是各部门独立负责的吗?”
林语说:“我们也在考虑是否应该将技术专利集中管理起来,统一公司的专利质量。但是目前仍旧是各技术团队自己负责。”
她的回答相对简洁,于是涂世欣在电脑上写下:“目前各技术团队独立管理专利。”
可是他看到李洛在电脑上记录了很长一段话:“继续跟进与收购目标企业的知识产权整合策略,技术重叠度、集中管理或是业务单元管理模式、国家地区应用范围等问题。与律师团队保持联系。”
涂世欣觉得李洛还不如带个录音笔,或许比带着自己更有用!