使用牧通人才网APP
轻轻松松找工作
随着人们对兽医学在生命科学研究领域中特殊地位认识的被逐步提高, 兽医科学的产、 学、 研过程中积累了大量的数据, 尤其在宠物和食品动物方面。例如, 食品动物的追踪朔源系统和宠物信息化管理系统的发展使用, 存储大量的管理数据和临床数据。
数据挖掘(Data Mining)是通过对众多学科中成熟工具和技术的集成和应用,从已有数据资料中获取有价值的信息。目前,数据挖掘技术已经成功应用于银行、 电信、保险、交通和零售等领域并发挥了巨大作用,在人类医学领域应用也获得了可喜成果,兽医领域中的数据挖掘虽已开始探索,但数据挖掘的应用相对较少。如何在这浩瀚的数据海洋中挖掘深层次的、隐含的、有价值的信息,是兽医教学科研工作者凾待解决的关键问题。因此,为了更有效分析整合现有数据资源,更好发挥兽医学在生命科学中的重要作用,了解和掌握数据挖掘技术是十分必要的。
1 概念与基础
数据挖掘 (Data Mining),也称数据源知识发现(Knowledge Discovery in Databases, KDD),是指从数据库的大量数据中获取有效、新颖、潜在有用、 最终可理解的模式和知识的非平凡过程。在兽医领域中数据挖掘搭建了兽医科学研究人员与计算机应用研究者之间的桥梁, 而是否能够有效发挥数据挖掘的作用, 基于数据自身条件和数据整合度。进行数据挖掘必须具备3个必须条件:其一,充足、有效的数据源是基础, 且要保证数据的质和量。其二,要由有计算背景的兽医研究者主导,因为只有兽医研究者才具备提出挖掘任务、确定挖掘目标、评价方法有效性以及集成的数据源的知识和能力。其三, 计算机应用研究者需要设计和开发更易于兽医研究人员理解与掌握的数据挖掘方法和技术。只有具备上述条件, 再通过二者充分交流后完美融合,才能挖掘出兽医领域中多样且创新性数据。
2 兽医学中的应用
我国人民已经实现了从生存向生活的转变,正在迈向幸福生活,对动物性食品要求从求量到求质,同时催生了宠物业的快速发展。另外, 信息技术迅猛发展和对兽医学的逐步重视,尤其随着食品动物的追踪朔源系统和宠物信息化管理系统的投入使用,收集到信息不仅包括影像、曲线、参数等各项生理生化指标,而且还有动物年龄、性别、生理状态、体重、既往病史等大量详细的背景资料,导致兽医学数据资料爆炸性增长。尽管数据库技术的发展解决了海量数据的存储和检索的效率问题,然而兽医学数据类型的多样性和数据量的庞大已经远远超出了使用者的理解能力,动物医保数据受自身的局限性和人为因素的限制,大量的数据只给出表征作用,未能得到充分利用。但至少为兽医领域的数据挖掘提供丰富的资源。
尽管存在诸多困难,起步较晚,通过借鉴其他领域以及人类医学数据挖掘方法, 汲取其他领域与人类医学数据挖掘的经验, 已经开始对动物医保数据进行挖掘并获取有效的信息,主要分布在以下3个方面。
2.1 在诊断上的应用
利用时间序列的发病统计数据 (如疾病防控中心公布的数据) , 挖掘其发病规律, 预测未来可能发生的时间, 以便能及早预防或应对, 防止重大疫病的大流行, 保障大众的身心健康。
通过数据挖掘对大量标本数据进行分析, 总结出其中的关键性指标, 比较健康和病理的细胞模型, 研究细胞的发生、 活动和调节的机制, 了解和揭示疾病发病过程, 寻找到有效致病分子和标记分子, 进行疾病的预警诊断, 提出防治和干预措施。
数据挖掘技术是处理图像分类的重要手段能够为新病例提供更精确的客观诊断依据,很大程度上避免了不相关图像的干扰,也减少了人为主观因素对病例诊断产生的不利影响能够很好地辅助医生进行诊断。提高兽医诊断的效率、 发现新的医学规律、 探索生命奥秘等, 最大限度地降低医疗风险, 提高治愈的成功率, 不仅会更好保障动物健康和降低医患纠纷, 还会提高兽医职业幸福指数。
2.2 在兽药上的应用
基因组学、蛋白组学、基因表达谱、蛋白表达谱、组合化学、高通量筛选、高通量检测等先进技术均已用于新药研发和遗传育种上,导致大量不同类型的数据产生。采用数据挖掘技术可以有效地存储、管理、分析及整合这些数据,用来寻找同药效学相关的有效化学物质基础,确定药效基团,指导新药的研究与开发,较随机筛选缩短新药的研究开发周期,降低研究开发费用。
随着耐药和残留威胁的扩大, 疫苗的应用范围逐步扩大, 从传染性疾病的预防疫苗扩展为预防疫苗、诊断疫苗和治疗疫苗(癌症疫苗),有效分析疫苗数据和科学设计疫苗的数据挖掘手段将会越来越受重视。另外,数据挖掘在药物检测上,疗效数据与副作用数据存在严重偏倚性,但是很多新药或新剂型都是源于药物检测数据的挖掘。
2.3 在教学上的应用
利用数据挖据的特征化原则、关联原则、聚类、分类等方法对自有和 Web临床信息进行分析,获取有价值的典型病例,归档入库,通过回放再现手术过程, 解决在校生教学进程中实时病例资源的匮乏。数据挖掘技术也可用于兽医教学方法的研究与改革以及兽医师执业深造和资格考试等培训。
3 存在的问题
虽然数据挖掘技术在兽医学领域已进行了一些尝试,但还处于起步阶段,存在众多挑战和难题。主要包含以下几个方面:
其一, 数据多型、 质劣和复杂。人类医保数是动态、 不连续、 不完整甚至错误的, 动物医保数据较人类医保数据具有更大的局限性。兽医学数据库不可能对任何一种疾病信息都能全面反映缺乏系统性, 而且许多兽医学信息的描述本身就具有不确定性和模糊性。另外, 加上兽医无法与病患交流、 动物种属众多和规避检查等使得数据更加复杂。
其二, 优秀信息人员的匮乏。信息人员应具备较高的计算机水平, 懂得数据挖掘和数据仓库方面的知识, 能够提出决策支持方面的需求。同时具备较强分析和评价各种数据挖掘技术的兽医专业水平, 以发现大量的潜在模式, 然后以可以理解的形式进行发布。
其三, 科技论文正确导向。过去的科技论文或者舆论导向过于注重成功案例数据, 失败案例数据十分匮乏, 这样造成文献数据的偏倚性。
4 展望
数据挖掘技术是一门涉面广、 技术难度大的新兴交叉学科, 在兽医学领域的探索刚刚起步,加之动物医保数据较人类医学更复杂。因此,兽医领域数据挖掘必将面临着较人类医学更大的挑战和更多亟待解决的问题。然而, 兽医领域具有浩瀚动物医保数据, 云计算平台应用于兽医学领域也将成为发展的必然。只要积极探索, 努力攻坚, 数据挖掘在兽医领域必将取得累累硕果,届时动物乃至人类将获益匪浅。
(华南农业大学兽医学院、广东省兽医临床重大疾病综合防控重点实验室 远立国,贾坤,孙凌霜,孙垚,韩太光,徐涛,袁榕,李守军)
上一篇: 首届草人牛人论坛在阿旗召开
下一篇: 海南首笔罗非鱼养殖收入保险落地