热门排序·最新发布
Luga Lee·None·系统架构师·2024-05-05
一文读懂Multi-Task Learning(多任务学习)
多任务学习(MTL)通过共享表示来同时训练模型以处理多个相关任务,提高泛化能力和个体任务的适应能力。参数共享策略包括硬参数共享和软参数共享,需考虑任务相关性、模型复杂度和训练数据量等因素。
评论2
赞1
Lancer·互联网·项目经理·2024-04-26
中信银行科技运营中心招聘运维架构岗(北京)
工作职责:1、参与或组织关键基础设施架构、技术路线、架构方案的研究和设计工作;2、参与或组织科技运营相关技术规范的编修订与持续...
Lancer·互联网·项目经理·2024-04-25
字节跳动招聘大语言模型算法工程师(北京)
职位描述负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断...
老菜_misa·123·123·2023-11-22
Azure AKS权限管理
文章介绍了在AzureAKS集群中,如何基于AzureADAuthenticationwithKubernetesRBAC和AzureADAuthenticationwithAzureRBAC两种认证模式,对集群管理员、应用管理员、项目应用管理员和项目应用只读人员进行授权。重点是授权的角色和权限范围,以及如何在命令行和portal上查看和操作对应资源。
评论0
赞4
Lancer·互联网·项目经理·2024-04-23
招行2024年海外人才招聘,涉大模型、多模态研发等岗位
基础大模型研发方向岗位职责:1、深入理解自然语言处理领域和大模型预训练技术,研究并掌握最新的预训练技术;2、负责预训练模型、训...
Lancer·互联网·项目经理·2024-04-23
中信银行北京分行发布数据分析、数据挖掘、运维岗位(北京)
数据分析岗岗位职责:负责提供基础性数据服务,包括数据咨询、数据提取等;负责监管数据的生成、提取、加工及报送等工作;3.负责推动个性...
danghl·icfcc·软件架构设计师·2024-04-18
基于开源大模型快速构建本地知识库应用
本文介绍了如何基于开源大模型快速构建本地知识库应用,包括知识库构建需求、数据挖掘和价值利用、语义知识检索、LLM大模型概述、知识库问答实现思路等方面。同时介绍了选择大模型的三个方面:业务需求、模型效果和模型性能。最终展示了RAG系统在处理大规模信息检索和理解任务时的巨大潜力。
峨眉山修行者·北京·QA工程师·2024-03-05
卷级实时备份的底层数据处理原理
一、任意时间点回退实时备份数据,意味着备份数据和生产数据是时刻保持一致的状态,在这种情况下,要做到任意时间点回退恢复,需要借助特...
评论0
赞0
Qq·红宇精密·工程师·2024-04-23
制造行业HPC平台性能调优方案(同业交流共识总结)
制造企业优化HPC性能:基础优化、并行计算、GPU加速、性能监控、软件工具、网络通信、缓存系统、云解决方案。不同品牌服务器统一调度:中间层软件、标准化作业脚本、虚拟化、容器化部署、硬件升级、供应商合作。提升吞吐和效率:高速网络互联、高可用性存储、优化作业调度、故障检测机制。HPC集群调优需综合考虑硬件、软件、算法模型等多因素。
评论3
赞2
Luga Lee·None·系统架构师·2024-04-25
常用 LLM Fine Tuning (微调)方法解析
本文介绍了大型语言模型微调的流程和技术,包括预处理、配置模型、训练模型、评估绩效、性能微调等步骤。其中,PEFT技术和LoRA技术是两种高效的微调方法,能够在保持预训练模型主干参数不变的前提下,实现高效的模型调优,为语言智能技术的应用场景拓宽了空间。
评论3
赞0