个人简历

🔗 个人介绍-在线双链笔记版 - 更丰富多维度的介绍

问题驱动型全栈解决者|善于构建可迁移的AI与数据应用系统

关键词:985本科 海外名校硕士 10年数据分析与算法应用经验 扎实数学基础 英文流利 全流程项目开发能力 理想方向:数据挖掘、机器学习、AI应用开发 目标行业:金融科技、智能制造、互联网平台、量化投资


个人信息

姓名:张宇翔学历:硕士研究生
性别:男出生日期:1988-12-22
电话:15982033650邮箱:yazyx88@163.com

教育背景

  • 2012.02—2014.11:澳洲国立大学,精算,硕士
  • 2007.09—2011.06:四川大学,应用数学(主),金融(第二专业),双学位学士

工作经历

2025.06 - 至今 | 北京数智科技公司 | AI 研发负责人

作为 AI 研发负责人,主导多个政府类项目的智能化升级,当前聚焦环保部智能应用系统,围绕智能问答、报告生成、知识图谱等核心场景构建完整 AI 能力链条。工作涵盖大模型技术选型、算法落地、系统集成与跨部门协作。

  • 基于开源基座,构建垂直领域 RAG 系统,实现环保知识的语义问答与任务驱动型智能交互;
  • 主导智能报告自动生成系统开发,融合信息抽取、结构化重组与大模型生成技术,显著提升文档生产效率;
  • 推进知识图谱建设,完成领域实体抽取、关系建模与图谱可视化,支撑智能决策场景;
  • 负责 AI 模型微调与推理部署,优化响应性能与准确率;
  • 管理跨职能团队协作,与产品、设计、工程等多团队联动,将 AI 方案落地到实际系统;
  • 跟踪国内外 AI 技术前沿,持续探索新模型与新机制的场景应用潜力。

2024.07 - 2025.05 | AI项目开发 & 前沿学习实践

围绕 AI 应用落地与技术探索,独立完成多个端到端系统开发,涵盖AI工作流、知识库RAG系统、智能客服 Agent、生成式(问答)与分类(意图识别)模型微调等方向,完整跑通后端逻辑、前端界面、算法集成与服务器部署,搭建完整产品应用,具备模块化、可复用的产品化能力。

项目已在多场景实际应用,包括:

  • 服务于公司(堪村信息港)的 知识库+嵌入模型+大模型|用户诉求RAG智能处理系统;
  • 与律所对接法律文书语义检索项目;
  • 完成两个面向保险行业的大模型微调项目,包括微调生成式问答系统与微调多分类意图识别系统,跑通了从数据构建、LoRA微调云端GPU训练到本地推理的全流程,显著提升专业问答与意图识别精度;
  • AI新闻智能工作流、作品管理系统、Uplift精准营销分析系统等项目也已上线运行。

在项目实践中深入学习并应用了大语言模型(LLM)、RAG、工作流、Agent 等能力,持续关注 AI 如何赋能数据理解、知识管理与复杂决策。

关键词:大语言模型、微调、RAG问答、工作流、多端部署、快速复用

2020.03 – 2024.06 | 浅行私募 | 策略研究员 & 合伙人

  • 负责量化策略研发与实盘应用,主导因子挖掘、策略优化与回测系统搭建
  • 独立开发基于遗传进化算法的交易策略,14个月实盘累计收益达 95% (同期A股上证指数收益 -11.26% ),成为公司最核心盈利策略,贡献超过 90% 总营收。策略具备强泛化能力,逐步替代原有研究与生产系统,项目表现突出,获邀成为公司合伙人。
  • 主导私募内部AI技术应用,研究并实现神经进化方法提升高维特征建模能力
  • 合伙人身份参与整体投资决策、团队管理与外部合作沟通

关键词:量化投资、策略开发、机器学习、Python、回测框架

2018.03 – 2020.01 | 蚂蚁金服 | 资深数据分析师

  • 负责智能客服、用户运营方向数据建模与分析支持,服务于百万级用户产品
  • 主导机器人解决能力智能分析项目,开发多维趋势分解算法,申请阿里内部专利
  • 推动智能圈人系统建设,应用高解释性算法挖掘提升营销人群圈选效率
  • 独立设计并开发全链路异常监控系统,提升运营团队响应速度

关键词:数据分析、趋势建模、关联挖掘、异常检测、Python、机器学习

2014.07 – 2017.10 | 堪村信息港 & 启新教育公司(澳大利亚) | 运营&数据分析

  • 在堪村信息港负责网站运营与数据分析,独立搭建微信机器人自动应答系统
  • 在启新教育公司负责数据分析体系建设,开发运营BI报表系统
  • 初步接触并应用机器学习方法(如回归、决策树)于业务问题

关键词:数据运营、BI系统建设、机器学习入门、爬虫、数据可视化


专业技能

  • 拥有10年数据挖掘与算法应用相关工作经验,覆盖数字化运营&数据分析,最优化算法&决策分析,数据挖掘&机器学习、深度学习及AI相关应用领域
    • 熟练掌握常用数据分析与挖掘方法论,具备优秀的问题定位与解决能力,能够快速针对实际问题提出高效可行的解决方案
    • 熟练掌握 随机 A/B 实验设计、 Uplift 因果模型 等科学方法,可独立完成拉新/留存场景下的精准人群圈选、灰度投放与评估。
    • 精通Logistic回归、决策树、随机森林、XGBoost、聚类分析、DeepFM、神经网络等主流机器学习算法,熟悉深度学习方法及前沿AI技术应用
    • 熟悉大模型AI相关开发应用,包括AI工作流,RAG,大模型微调等,实现从数据驱动到自动化智能应用的系统落地
    • 了解知识图谱构建与应用流程,实体抽取、关系建模、图算法、图数据库与图谱可视化
    • 了解 PySpark 分布式数据处理框架
  • 能独立完成小型系统的全流程开发
    • 涵盖后端逻辑、前端界面、算法模块、数据库设计与服务器部署,搭建完整产品应用
    • 技术栈包括 Python、MySQL、Linux、 基础服务器运维等能力,应用在办公效率, 信息化管理系统等等地方
  • 数学&英语能力
    • 具备扎实的数学基础,能够独立查阅英文文献并实现复杂算法,在实际项目中快速落地应用
    • 拥有五年以上海外留学及工作经历,英语流利,能够在跨文化、跨地区环境中高效沟通与协作
  • 具备快速学习和迁移能力,善于洞察问题本质,提炼解决方案,解决一个问题,就解决了一片问题

部分项目经历

全链路智能机器人 | 蚂蚁金服 | 2018

🔥 项目背景:公司运营日常需监控多个核心业务指标,一旦波动需人工排查复杂链路,耗时高,且容易漏查。已有监控报表无法满足多维度、全链路快速定位问题的需求,影响运营效率和响应速度。

🚀 解决方案:基于Python自研 全链路监控与分析框架,覆盖全部业务链路及多维数据,自动识别异常节点并生成问题定位报告,发送钉钉群并 @相关负责人

🎯 项目效果:成功上线后,单日为运营同学节省约 3小时 排查时间。思想和代码框架在公司内部多个部门复用,有效提升了业务异常响应速度和问题定位准确率。

机器人解决能力智能分析&提升 | 蚂蚁金服 | 2019

🔥 项目背景:公司机器人客服系统存在大量转人工请求,转人工率高,需优化机器人解决能力。由于业务维度繁多且交叉,传统单维度分析方法难以快速准确定位问题,导致运营响应滞后,影响用户体验。

🚀 解决方案:引入 学术界 LMDI(对数平均拆解指数)方法,自研适用于业务场景的多维拆解算法,基于Python自研开发自动化分析脚本。系统支持将转人工率按各业务维度、子维度量化分解,细化到分子(求助量)与分母(请求量)两部分,供运营快速识别异常源头, 拆解不同维度的贡献度且高解释性。

🎯 项目效果:成果开发为正式线上监控产品,覆盖每日 百万级 请求,然后复用在机器人客服、满意度、FCR等多个关键指标监控场景,极大提升了运营决策效率,相关算法已申请阿里内部专利

这个方法适合解决所有分子/分母 (比如转化率,满意率等) 的两周期对比的多维拆解贡献度问题,洞察问题本质解决一个问题,就解决了一片问题

🔄 后续 (2025): 搭建了前端使用 (搭配后端算法,数据库存储和服务器部署,是一个成熟可用的数据挖掘产品) 点击访问网站(电脑端或手机浏览器打开) ,可使用demo数据分析,也可自主上传数据并生成报告, 查看示例报告(电脑端或手机浏览器打开)

营销服务智能圈人 | 蚂蚁金服 | 2019

🔥 项目背景:公司需根据不同业务场景(拉新、留存、降求助)精准圈定用户进行营销推送。传统方式依赖运营主观人群描述(效率低,人群精准度低)或黑盒机器学习模型(可解释性差、运营执行困难)

🚀 解决方案:引入 Apriori 关联规则挖掘算法,结合业务实际改写算法逻辑,建立基于特征规则的人群圈选方法。基于Python自研开发了自动化流程,包括数据预处理、信息增益切连续变量、WOE/IV特征选择、关联规则挖掘全流程仅需导入数据和设置参数,自动输出精准人群及规则**。

🎯 项目效果:成果应用于2019年保险重点项目一半以上人群圈选规则直接采用挖掘结果,显著提升了圈人准确率 (AB-test平均提升12%) 和运营效率。相关功能被纳入公司数据智能产品,然后复用在留存、NPS、求助分析、调研满意度分析等多个场景

这个方法适合解决所有 x 和 y 的二分类(比如人群转化、满意度等)高解释性特征挖掘问题,洞察问题本质解决一个问题,就解决了一片问题

🔄 后续 (2025): 搭建了前端使用(搭配后端算法,数据库存储和服务器部署,是一个成熟可用的数据挖掘产品点击访问网站(电脑端或手机浏览器打开),可使用 demo 数据分析,也可自主上传数据

用户诉求量多维趋势分析 | 蚂蚁金服 | 2019

🔥 项目背景:用户诉求数据来源多样,包括电话、在线渠道,不同产品线和功能模块,数据量大且维度复杂,传统分析方法难以快速定位重点变化趋势,影响运营决策效率。

🚀 解决方案:阅读并基于Python自研实现《Extracting Top-K Insights from Multi-dimensional Data》论文的方法,针对诉求数据在各维度(如渠道、产品、功能模块、时间)及其交叉维度进行分组,采用线性回归、R方、p值等统计方法量化趋势变化,结合业务占比综合评分,自动提取显著上升下降预警的趋势,形成可供决策参考的Top-K洞察

🎯 项目效果:在蚂蚁金服任职最后 1 个月内完成开发,已完整跑通数据分析与洞察提取流程,具备快速复用能力,可灵活应用于销售量趋势分析、运营监控、客户服务量波动分析等场景。

这个方法适合解决所有数值量(比如销售量、求助量等)的多周期对比的多维拆解贡献度问题,洞察问题本质解决一个问题,就解决了一片问题

🔄 后续 (2025): 数据结果跑出来之后,结合大模型可快速生成一篇洞察报告,查看示例报告(电脑端或手机浏览器打开)

遗传进化算法策略开发 | 浅行私募 | 2021-2023

🔥 项目背景:传统因子挖掘方法依赖人工经验,效率低下,使用常规机器学习模型存在可解释性差的问题;部分高频交易策略对运行速度要求极高,需开发兼顾可解释性与执行效率的规则型策略。

🚀 解决方案:基于Python自研遗传进化算法,设定多目标函数(收益率、最大回撤、因子简洁性)自动化挖掘交易因子与组合规则;自研回测框架,支持策略快速验证与迭代优化,实现了策略的 自动挖掘、筛选与部署流程

🎯 项目效果:策略自 2021 年 10 月至 2022 年 12 月实盘运行,累计收益率达 95%;因表现优异,该方法逐步替代了原有多套手工开发及黑盒机器学习策略,成为主力生产策略。后端底层遗传进化算法已成熟,具备快速复用能力

这个方法适合解决所有具备明确目标函数但解空间庞大、无法穷举的优化类问题(比如人员排班、投资组合优化、物流路径规划、自动化因子挖掘、模型参数选择等)。它具备良好的全局搜索能力可解释性,洞察问题本质解决一个问题,就解决了一片问题

神经进化算法研究与应用探索 | 浅行私募 | 2024

🔥 项目背景:传统遗传算法在低维特征规则挖掘中效果良好,但在面对高维复杂特征空间时,表现出搜索效率低、收敛速度慢的问题,难以满足实际业务需求。

🚀 解决方案:探索结合神经网络与进化算法的神经进化(Neuroevolution)方法,基于最新Transformer架构设计适应度评价模型,并利用 8颗英伟达 A100 GPU 进行大规模训练与进化优化。项目搭建了完整的实验流程,包括目标定义、训练过程监控、模型进化与策略评估。

🎯 项目效果:成功实现了神经进化算法在高维特征空间的训练与优化,技术验证阶段跑通全部流程,具备一定泛化能力。由于实际业务需求变化,策略未进入实盘应用,但本项目为后续高维特征挖掘方法探索积累了重要经验

这个方法适合解决具备明确目标但缺乏梯度信息或搜索空间不规则的优化类问题(比如游戏中自动学习过关策略、量化因子的组合优化等)。它融合了进化算法的全局搜索能力与神经网络的非线性表达能力,适用于复杂环境中的结构优化与策略演化任务。

知识库+嵌入模型+大模型 | 某律所 & 堪村信息港 | 2025

基于嵌入向量与大语言模型,开发本地知识库系统,支持多知识库管理和多文件格式(MD、PDF、Word、Excel、PPT)处理。核心技术包括使用Embedding进行向量转换,FAISS向量数据库实现高效语义搜索,结合LLM完成Retrieval-Augmented Generation ** RAG问答。系统已完整跑通数据处理、检索、问答全流程,可快速扩展复用于个人或企业知识管理、文档智能检索、垂直领域智能助手**及离线文档分析等场景。 当前已成功应用于:

  • ✅ 堪村信息港用户诉求系统 点击访问网址
  • 🔄 正在与某律所沟通中,拟将系统应用于法律文书语义检索与智能问答场景;
  • ✅ 个人笔记语义问答助手。

AI新闻智能工作流开发 | 自研项目 | 2025

🔥 项目背景:现有资讯来源信息量大且杂,自媒体内容片面、情绪化严重,缺乏系统性、客观性的新闻摘要与聚合服务,影响信息筛选效率与准确性。

🚀 解决方案

  • 后端基于Python自研资讯获取模块,整合 RSS爬虫 数据源,自动抓取感兴趣领域内容
  • 使用 大语言模型(LLM) 对原文进行摘要生成、情感打分、标签分类,并通过摘要 embedding 表征进行聚类和相关性过滤
  • 设计多级摘要流程:初步摘要 → 相似性过滤 → 综合总结,确保最终输出内容客观、简洁、无冗余
  • 前端使用 HTML + Tailwind CSS 开发轻量级界面,展示最新精选资讯,支持来源管理与关键词订阅

🎯 项目效果:搭建完成网站 点击查看网站(电脑端或手机浏览器打开),实现后端全流程自主控制,支持灵活切换资讯来源、调整感兴趣话题,显著提升了信息筛选效率和内容质量,为自我学习与信息检索提供了高效辅助平台。

这个框架适用于自动化信息处理工作流,支持模块级编排多阶段任务串联,适用于各类数据驱动的结构化处理场景

智能多链路客服Agent系统开发 | 自研项目 | 2025

🔥 项目背景:在真实客服场景中,用户问题复杂多变,单一回答逻辑难以满足需求,需能够根据不同意图动态选择合适工具(FAQ检索、工单创建、投诉转人工等)的智能对话式系统。

🚀 解决方案

  • 基于 LangChain 搭建智能多工具 Agent,整合 FAQ 检索、工单系统、投诉处理模块
  • 通过 大语言模型(LLM) 识别用户意图,动态路由至最优工具,统一生成自然语言回复
  • 前端采用 Gradio框架,搭建 Demo 站点 点击查看网站(电脑端或手机浏览器打开)

🎯 项目效果:成功实现智能多链路处理的客服Agent原型,具备良好扩展性,可快速迁移应用于企业智能客服、售后自动化等场景。


微调多分类意图识别系统(保险领域) | 自研项目 | 2025

基于 Qwen1.5-1.8B 构建保险意图识别模型,覆盖 60+ 业务意图,通过 LoRA 微调实现轻量定制,完成从数据构造到训练、推理的闭环流程,支持 Top-K 多意图预测与部署,实测准确率高,适用于智能客服等场景。


小而美项目

作品管理系统 | 2025

多维度标签筛选与模糊搜索的作品管理系统,支持按标签、评分、年份等条件动态过滤,提升个人项目资料管理与分享效率,系统已完整跑通,可快速扩展应用于个人作品集、项目管理或内容展示平台。(目前用于个人项目-点击查看网站(电脑端或手机浏览器打开),摄影作品-点击查看网站(电脑端或手机浏览器打开)

Markdown可视化渲染工具 | 2025

前端渲染框架,支持对Markdown文档进行在线预览与结构化展示,支持Mermaid、LaTeX、图表等可视化能力,适用于技术文档、数据报告、学术笔记等内容的快速分享与可视化表达。目前已用于项目输出、自动化报告场景(比如:比如上面的数据挖掘案例 查看示例报告(电脑端或手机浏览器打开) )。也可仅作为markdown渲染工具使用 电脑端或手机浏览器打开

选导师(数据应用)| 某高校 | 2022 - 2025

基于Streamlit框架开发学生-导师选择匹配系统,面向50+位研究生导师与200+名学生,支持双向选择与简历管理。系统设置学生、导师、管理员三种角色,学生可浏览导师信息并提交申请,导师可查看申请并确认学生,管理员可监控系统状态与导出数据。后端使用MySQL数据库存储,配合简单登录验证保障数据安全。该系统成功实现研究生导师双向选择流程的信息化管理,提升了匹配透明度与处理效率,简化了学生与导师间的沟通流程。(项目为协助朋友开发, 连续用了4年了,这几天正在使用,使用完成后可发网站体验)

其他

  • 体系化学习与思考能力:善于提炼问题本质,搭建思维导图,遇到问题能快速分析、拆解与总结
  • 快速学习能力与知识管理:对新鲜事物保持高度好奇心,面对未知问题,能在短时间内完成信息获取、结构搭建与方案形成,具备强自驱学习与迁移能力; 已建立5000+篇个人笔记体系,支持快速拼接知识解决新问题,若存在缺口,能迅速识别并补充完善
  • 逻辑思考与竞赛经历:四川省国际象棋冠军,国家二级运动员,chess.com全球排名top 0.1%,全国中学生数学竞赛三等奖,成都七中竞赛优胜奖
  • 兴趣爱好:魔术(2019年阿里两大部门年会魔术表演者,堪培拉魔术协会会员,2年兼职聚会近景魔术师)、摄影(阿里系足球决赛拍摄&剪辑)、运动 (羽毛球)
  • 团队管理与组织能力:曾任四川大学志愿者社团会长,组织大型校内外志愿服务活动
  • 学术交流与视野扩展:持续与蚂蚁、字节等一线大厂的算法同学保持交流,关于机器学习,AI大模型等应用落地实践,紧跟前沿趋势,拓展技术视野。