课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
近日,Oracle开源了一个用Java编写的机器学习库,名为Tribuo。它提供了用于分类、回归、聚类、模型开发等的工具。也为许多流行的第三方机器学习库提供了统一的接口。
Oracle提到,他们这些年来致力于将机器学习模型部署到大规模的生产系统中。在这个过程中,他们发现,企业的期望往往与现有的机器学习库提供的功能之间存在着鸿沟。
举例来讲,大型的软件系统通常希望可以使用可自我描述的构造块,并判断其何时输入或输出无效。然而大多数机器学习库依靠一堆浮点数组来训练模型。在部署时,输入是一个浮点数组,并且产生另一个浮点数组作为预测输出。关于这些数组中任何一个的含义,或输入/输出浮点数应该是什么样的描述,都留给Wiki和错误跟踪器,或被写为代码注释。Oracle指出,开发者不会希望为每个机器学习模型添加另一个数据库表只是为了解释输出浮动数组的含义。
另一方面,在生产中跟踪模型也很棘手,因为它需要外部系统来保持已部署模型与训练过程和数据之间的链接。Oracle的机器学习研究小组认为,将这些额外的要求直接嵌入机器学习库会好得多。
从编程语言上来看,大多数流行的机器学习库都用Python和R等动态语言编写,而多数企业系统是基于Java等静态类型语言的。这就要求企业同时使用不同语言来编写代码,并确保其运行,也会因此产生更多的代码维护成本和系统开销。
此次开源的Tribuo则能够妥善处理这些问题。Tribuo具有数据加载管道、文本处理管道和功能级别转换,可在数据加载后对其进行操作。它知道自己输入/输出了什么,并可以描述每个输入/输出的范围和类型。
使用Tribuo从其他系统和语言部署模型也很方便,它提供了指向ONNX Runtime、TensorFlow和XGBoost的接口。其中,对onnx模型的支持允许在Java中部署一些Python软件包(例如pytorch)训练的模型。
Tribuo目前支持Java 8及更高版本。Oracle表示该机器学习库已经在公司的内部生产中运转了数年。
选择的人多的机构就是好机构,达内每年近10万学员的选择,来达内给你一个不一样的培训体验。达内目前开设24大课程体系,Java编程、UI设计、网络营销、web前端培训等课程。达内每月开设免费课程试听训练营,欢迎来电预约免费试听,领取免费课程资料。来合肥java培训,让你的人生有不一样的精彩。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!