OGSP( Ongineer Service Platform )是奥工科技自主研发的面向终端计算用户的、安全、可进化的密集计算服务平台。OGSP秉承云原生设计理念,搭建密集计算场景中基础侧、平台侧、应用侧的生态服务架构,谋求基础侧的稳定、健康、可扩展性;平台侧的高效、动态、易用性;应用侧的专业、交互、场景化。将服务产品化、产品场景化,为用户提供基于实际生产场景的一站式密集计算服务。
OGSP广泛应用于泛气象、泛生命科学、教科研、工业制造、人工智能、军工等关键领域
一键部署
维护简易
功能丰富
应用全面
管理专业
运营精细
稳定可靠
安全可控
满足万核以上的大规模并行计算场景。赋能气象研究、灾害预警、航空航天、精尖制造等高精尖项目,解决其对计算资源和性能的极致追求。
( 不同云微做物理过程参数化方案的模式降水预报敏感性测试 )
满足Windows和Linux两种系统环境下图形交互作业资源的调度,优化CAE、EDA等前后处理场景中对资源的利用率。赋能芯片制造、工业仿真、生物制药等对计算性能和经济性兼顾的需求。
( 手机扬声器的模型处理 )
满足Al的模型训练场景下,实时快速进行人工智能算法模拟与优化,以扩大Al训练的规模、加速迭代的效率。赋能自动驾驶、智慧医疗等Al场景在高性能计算集群中的最佳实践。
( 使用jupyter调整AI模型 )
为用户提供命令行的执行环境,并能够实时快速监测到WEBSHELL中的可疑内容,进行智能的拦截和提醒。解决各类计算场景命令差异化和安全性的矛盾。
( 使用WEBSHELL登录login节点 )
提供基于高性能计算场景的工作流引擎,串联前后处理的全流程,以提升各专业部门、应用、数据之间的协作,加速成果的转化。赋能气象研究、芯片制造、基因测序等复杂业务场景的流程化需求。
内存 CPU
GPU 负载
使用率
空间使用率
磁盘状态
节点挂载
用户配额
节点状态
队列明细
队列核数
实时作业情况
机时汇总
环境温度
硬件告警
节点警告
邮件通知
公众号显示
无缝对接OGCR智能监控
支持webhook、api等方式的告警接入。
Al智能降噪算法,快速识别并归并异常事件告别告警风暴。
自动任务触发,告别重复运维。
运维知识库积累,助力团队持续优化。
支持CPU、GPU、存储用量、存储配额、内存、License等多种资源的计费,可按用户的实际计算场景进行计费资源选型。
实时感知资源的使用和消耗情况,将资源计费的及时性提高到秒级以内,真正实现资源的实时计费。
提供多级资源套餐,支持账号托管费、设备托管费等多种计费场景;增加满额返充、资源包年等方案,充分满足计算用户的经济性需求。
提供海量的经过实际检验的计算作业模板
通过容器快速构建应用的计算环境
海量的本地行业数据源,告别漫长的下载等待与更新
辅助客户进行集群的标准化建设和优化,提供应用软件与硬件的适配,集群组件工具的完善,集群配置和管理的标准确立。
提供一键安装包和升级包,进行OGSP的快速部署和版本升级,减少因为系统升级对用户带来的影响。
在新老平台的割接过程中,提供用户数据、账号、应用环境的无损迁移,保障业务的连续性。
提供应用软件的集成服务,快速部署应用软件并提供计算脚本和界面化的作业模板。