公司AI大模型模型参数训练数据发布时间应用场景AIGC应用场景百度文心·NLP大模型 文心·CV大模型 跨模态大模--发布时间智能搜索智能云自动驾驶智能地图汽车智能化解决方案智能家居AI作画AI写作AI编剧AI语音AI视频创作数字人阿里M610万亿-发布时间阿里云钉钉AI海报设计openAIGPT-1GPT-2GPT-3ChatGPT1.17亿15亿1750亿1750亿5G40G45T2018年6月2019-22020-52022-11对话对话元语智能ChatYuan百亿-2022-11-对话华为盘古----对话华为+中科院自动化所紫极太初千亿---对话北京智源人工智能研- 阅读剩余部分 -

参考文献:1.https://zhuanlan.zhihu.com/p/5906556772.https://mp.weixin.qq.com/s/3bOFfODR7rpnyzrpocHlfQ3.https://zhuanlan.zhihu.com/p/592671478

一、Cython用cython是将.py文件转化为.so文件,这样加密的可靠性非常高,无法被被人破解,也就很好地保护了源代码。1.环境准备安装cython,以及gcc编译环境pip install cython yum install -y gcc python-devel2.编译脚本编写compile.py文件,内容如下:from distutils.core import setup from Cython.Build import cythonize setup( ext_modules = cythonize("test.py") )2.- 阅读剩余部分 -

1.创建、启动虚拟环境conda create -n env_name python=3.7 conda activate env_name如果出现如下类似错误:nvalidArchiveError(‘Error with archive /usr/local/Anaconda3/pkgs/sqlite-3.36.0-hc218d9a_0stdo5ow0/info-sqlite-3.36.0-hc218d9a_0.tar.zst. You probably need to delete and re-download or re-create this file. Me- 阅读剩余部分 -

1.前缀提示Controllable Natural Language Generation with Contrastive Prefixeshttps://arxiv.org/pdf/2202.13257.pdf2.Response Generation with Context-Aware Prompt Learninghttps://arxiv.org/pdf/2111.02643.pdf3.Planning with Learned Entity Prompts for Abstractive Summarizationhttps://arxiv.org/pdf/- 阅读剩余部分 -

一、abstractIn order to make full use of medical knowledge graph in medical dialogue systemsolve the problems of effective medical knowledge missing and medical dialogue generation uncontrollable, we propose a sentiment

一、背景说明1.什么是爬虫通过编程,模拟浏览器上网,然后让其去互联网上抓取数据的过程,我在一般都是用来爬取网上的数据玩,有时候也会用爬虫来下载图片。2.爬虫中的矛与盾反爬机制:门户网站通过制定响应的策略或者技术手段,防止爬虫程序进行网站数据爬取反反爬机制:破解反爬机制robots.txt协议:规定那些数据可以爬取,哪些不能爬取。注意:数据不能乱爬吼,要遵循,robots.txt的协议哦[狗头]。3.爬虫的分类通用爬虫:抓取互联网中的一整张页面数据聚焦爬虫:在通用爬虫的基础上,抓取页面中的特定的局部内容。增量爬虫:检测网站中数据更新情况,只会抓取网站中最新更新出来的数据4.爬- 阅读剩余部分 -

ACL 2022 中关于如何进行主题切分的一篇文章和关于如何提高对话生成质量的两篇文章。基于端到端分章节的新闻摘要生成End-to-End Segmentation-based News Summarization论文地址:https://aclanthology.org/2022.findings-acl.46.pdf为了更好地理解长篇新闻,该文章提出了基于分章节的新闻摘要生成任务,该任务的目的是将一篇新闻文章分成多个部分,并为每个部分生成相应的摘要。作者创建了一个新的新闻数据集 SEGNEWS,并提出了一种新颖的端到端方法,该方法可以将文章分割任务和相应摘要生成任务联合- 阅读剩余部分 -

一、背景随着信息时代的到来, 数据呈爆发式的增长, 如何从这些数据中通过智能技术自动提取出真正有价值的信息尤为重要。知识图谱是一类知识表示, 由实体、关系以及属性构成。知识图谱的构建过程: 首先从数据源中提取出碎片化事实, 然后对碎片化事实进行知识的融合, 再经过知识加工后通过迭代更新建立基于知识的体系显然, 知识图谱的构建过程包括: 信息抽(information extraction), 知识融合, 知识加工等。信息抽取作为知识图谱的主要组成, 从数据源中抽取出实体和实体之间的关系等结构化信息包括对实体、关系以及事件等方面的抽取。1.面临的问题知识图谱中的信息抽取面对着- 阅读剩余部分 -

一、知识图谱构成1.需要抽取模型知识图谱的抽取一般需要三个模块:实体识别、属性抽取、关系抽取,有时候还有事件抽取。2.工具评测标准1.抽取模块是否齐全2.抽取准确率是否高3.抽取是否支持小样本学习4.是否支持标注工具二、抽取工具介绍1.UIE-百度(1)背景介绍官方地址1(paddle版本):https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/uie官方地址2(pytorch版本):https://github.com/heiheiyoyo/uie_pytorch论文地址:https://arxi- 阅读剩余部分 -

Three PoliciesYour assistant uses policies to decide which action to take at each step in a conversation. There are three different policies that the default config.yml file starts out with:1.The RulePolicy handles conversations that match predefined rule patterns. It makes predictions bas- 阅读剩余部分 -

一、相关竞品产品调研1.左手医生https://open.zuoshouyisheng.com/--优先2.百度灵医https://01.baidu.com/index.html (线上无法体验)3.科大迅飞-全科辅诊诊疗系统http://www.iflytek.com/health/qkfzzl (线上无法体验)4.阿里健康https://www.doctoryou.ai/dm5.腾讯https://tencentmiying.com/official/二、相关文章1.https://zhuanlan.zhihu.com/p/3792029492.https://zhua- 阅读剩余部分 -

FLAT主要创新点在于:(1)基于Transformer设计了一种巧妙position encoding来融合Lattice结构,可以无损的引入词汇信息。(2)基于Transformer融合了词汇信息的动态结构,支持并行化计算,可以大幅提升推断速度。一、背景ACL2020中一篇来自复旦大学邱锡鹏老师团队的 FLAT: Chinese NER Using Flat-Lattice Transformer 刷新了中文NER任务的新SOTA。论文链接:https://arxiv.org/pdf/2004.11795.pdf开源代码:https://github.com/LeeSu- 阅读剩余部分 -

一、查看通过pip库版本1.查看已经安装的所有库版本pip list2.查看已经安装的某个库版本pip show paddlenlp3.查看将要安装的某个库版本pip index versions [your python module name] 例如: pip index versions paddlenlp 或者 pip install paddlenlp== 二、pip离线安装一个包1.离线下载#pip download 你的包名 -d "下载的路径(windows下双引号来表示文件夹)" pip download paddlenlp -d - 阅读剩余部分 -

一、NER任务分类NER任务分成三大类

r-drop本质上是一种有监督的数据增强方式SimCse本质上是一种无监督的数据增强方式对比学习标准流程:对比学习的标准流程是同一个样本通过不同的数据扩增手段得到的结果视为正样本对,而 batch 内的所有其他样本视为负样本,然后就是通过 loss 来缩小正样本的距离、拉大负样本的距离了。一、相关背景关注 NLP 新进展的读者,想必对2021年4月份发布的 SimCSE印象颇深,它通过简单的“Dropout 两次”来构造正样本进行对比学习,达到了无监督语义相似度任务的全面 SOTA。无独有偶,最近2021年6月份的论文《R-Drop: Regularized Dropout- 阅读剩余部分 -