每周AI应用方案精选:智能投顾技术;AI 合成生物学等
弘量研究采用新型的模型,使用复杂的参数统计的方法,来攻克已是世界难题的相关性轨迹分析。帮助金融机构降低成本,提升资产管理能力。 该智能投顾系统先对用户进行问卷调查,涉及年收入、总投资额度、偏好投资的地区和行业等。 投资者提交调查问卷后,智能投顾系统会对其风险偏好进行自动打分,计算投资者的风险偏好是何种类型,是保守型还是进取型,进而推荐在美国交易的全球的 ETF 组合。系统会自动生成投资组合,也会自动下单,并自动调整仓位,还会自动生成投资报告。
弘量研究建立了承载各式因子的大型数据库,在收到订阅的大型数据供应商彭博、万得等提供的实时数据后,进行格式调整,价格确定等数据清洗来监控每支 ETF。而监控的每支 ETF 的因子多达 40 多个,既有 GDP、就业等宏观因子,也有企业层面的财务状况等微观因子。实现对市场的动态监控,及时调仓。而因子的选择也是动态的过程。 全流程自动化的背后是一整套算法。首先,通过算法来分析投资者的风险偏好。其次,根据投资者在区域和行业上的投资偏好,通过算法分析如何配置资产权重,进而推荐全球的 ETF 组合。再次,利用前沿的金融工程和统计方法确定每支 ETF 的最优权重,并根据金融市场的变化,不停地用算法监控投资组合,当投资者当前持仓和最优权重之间出现差异时,再及时调仓,进行调整。
以往,当考生进入考场时,需将身份证、准考证放在课桌的左上角,监考老师拿着一本印满考生黑白照的花名册逐个比对。从考生这边来说,由于紧张或慌忙可能会忘记携带相关证件,另外考试过程中,老师走近的比对工作会让某些考生分神,影响考试;从监考老师这边来看,他们的工作量也很大,要在很短时间内尽可能地去确保照片与考生本人一致。 基于人工智能的人脸识别方案,能够快速识别出考生人脸,并与图库中的相片作比对,如果发现异常,将秒级提示,提醒管理者(监考老师)人工二次查验。未来,系统中将加入声纹识别功能,在考生线上录入时进行二次验证,大大增强系统可靠性。 该方案具有以下特点: 1.考生身份核实解决方案基本可以做到无感知,采集比较方便; 2.单以教育考试来说,如果采用虹膜识别,必须先采集虹膜,而这就要求考生去某个线下点去采集,不够便利; 3.很多人的指纹并不是特别明显,另外安全性不高。
平安科技人脸识别解决方案的整个「识别」过程包括考前、考中、考后。 1. 考前:首先,考生在网上报名。当考生在教育部网站做好报名的基础信息录入工作后,系统会自动跳转到研究生考试的网上照片采集平台,平台会要求考生上传一张高清照,之后与的身份证底片做比对,避免在报名环节就遭遇; 2. 考中:在以往,考生需要携带身份证、准考证等各种证件赴考,而现在无须携带证件。在考场,老师首先打开终端(手机或者 pad)以该考场的考生图片都会显示在上面,考生过来之后,终端即可识别; 3. 考后:当考生被录取并到所在学校报名,相关学校也可根据这张照片进行验证,再次确认是否与当时报名、考试的考生一致,保证全流程无。
近年来合成生物学成长很快,科学家们已经不局限于非常辛苦地进行基因剪接,而是开始构建遗传密码,以期利用合成的遗传因子构建新的生物体。有人甚至认为合成生物学将催生下一次生物技术。但目前的合成生物技术大多还是手动,这需要大量的时间、劳力以及丰富的领域经验。生成对抗网络(GANs)则代表了将 AI 技术应用于合成生物学中,来生成真实数据(例如基因、蛋白质、药物等)的一种新颖的方法。但若要保证合成的分子可以应用于各种真实环境中,不仅仅是要用 GANs 生成新型的序列,还需要根据所需性质对产生的序列进行优化,例如序列对特定配体的亲和力,或者所生成的大分子的二级结构等。
作者在文章中,提出了一种新的利用 GAN 生成 DAN 的反馈循环机制,并使用单独的预测期(称为「函数分析器」)来优化这些序列,以获得期望的属性。作者使用这个模型做了两个案例实验: 1)生成抗菌肽的编码 DAN 序列; 2)生成α-螺旋抗菌肽的编码 DAN 序列。 其中前者对细菌、病毒和真菌具有广泛的抗菌活性,由于它们通常很短(少于 50 个氨基酸),因此用来作为 GANs 模型的案例很具优势。第二个案例,主要是考虑到蛋白质二级结构(例如α-螺旋或β-折叠)的问题,这种二级机构即使在较短的肽中也会出现。 工作的新颖点在于:首次将 GANs 的技术应用于带有反馈回路机制的生物序列合成;证明了这种训练机制对于所有类型的分析器都有很强的鲁棒性,可以针对特定的特性设计特定的分析器。例如作者分别采用 RNN 分析器和 PSIPRED 分析器优化编码抗菌肽的基因和优化编码α-螺旋肽的基因。
2. 分析器,在第一个使用案例中,作者选用一个可微分神经网络作为分析器,它接收基因序列并预测序列编码抗菌肽的概率。 事实上分析器是一个黑箱,它的作用就是接收基因序列,并用一个分数来预测基因序列的可取性。
例如在α-螺旋肽编码 DAN 序列的案例中,作者用 Web 服务器作为分析器,返回一个基因编码α-螺旋残基的数量。分析器甚至也可以是一个科学家,他们可以通过实验来验证生成的基因序列。GAN 和分析器在一定的预训练历元(pretraining epochs)后通过反馈机制连接起来,这时候发生器(Generator)才能产生有效序列。一旦反馈机制开始,在每个历元中,发生器 G 产生一定数量的序列,随后输入到分析器中;分析器预测每个基因序列的有利程度,并将 n 个最有利的序列输入到鉴别器(Discriminator)中,作为发生器必须模仿以最小化损失函数的「真实」数据。
随后就和通常 GAN 的训练一样了。随着反馈过程的继续,在每个历元中,鉴别器 D 的整个训练集都将被分析器中分数最高的生成序列所替换。
合成生物学在很多领域具有极好的应用前景,例如更有效的疫苗的生产、新药和改进的药物、以生物学为基础的制造、利用可再生能源生产可持续能源、环境污染的生物治理、可以检测有毒化学物质的生物传感器等。
科大讯飞「iFLYTEK-MIG」团队在病灶分割比赛的 MA(微动脉瘤)子项目上排名第一。iFLYTEK-MIG 团队在比赛中检测的微动脉瘤(MA)实际上是非常之小的,在一张 4000x3000 像素的图上,MA 可能只占 10x10 个像素左右,很容易被医生遗漏。根据调研,高水平的医生看一份眼底图找到一个 MA 可能要耗费 4 到 5 分钟,目前iFLYTEK-MIG的系统只需要几秒钟,而且速度还有优化空间,可以大幅提高医生的工作效率。
与自然场景图像不同,眼底图像的分辨率一般在 4000*3000 像素左右,而有些小的 MA 病灶可能仅占有几十个像素,而且不同病灶的面积往往相差很大,因此会导致正负样本比例失衡、检出特异性(specificity)较低等问题。」。 针对以上难点,他们基于 coarse-to-fine 思想做了如下改进:
1.在 Encoder-Decoder 框架下融合空洞卷积操作、self-attention 机制,设计出一种新的分割网络,在不损失原始图像信息的前提下,快速定位出可疑病灶区域并给出分割边界。
由生物医学成像领域学术会议 ISBI((IEEE International Symposium on Biomedical Imaging)举办的 IDRiD 眼底图分析竞赛成绩揭晓。眼底图分析竞赛共分为病灶分割、疾病分级、视神经盘与中央凹检测三个分赛道,病灶分割比赛中包括微动脉瘤(MA)、出血点(HE)、软渗出(SE)、硬渗出(EX)四个子项目
每天清晨,洛杉矶的治安巡警们都要列队点名,并且每个人的电子设备都会收到一份当日的「犯罪预测电子地图」。在这份电子地图上,红色小方框所在的位置代表着这个地区在当日极有可能会发生犯罪活动。所以巡警们会在这个犯罪「热点」地区提高警惕,加强巡逻,很快,巡警们在「热点」地区收到了来自实时犯罪预警中心的警告信息:帮派斗殴即将发生,盗窃案即将发生,抢劫即将发生...... 巡警要采取相应行动去阻止这些所谓的犯罪嫌疑人进行犯罪活动。比如,一名正在调查一起抢劫案的警探仅需在系统中输入少量有关犯罪嫌疑人的名字信息和身体描述信息,就能找到最有嫌疑的犯罪嫌疑人。系统会迅速为警探提供嫌疑人的年龄,身体描述,地址,帮会,汽车等信息的排序选择,然后系统通过匹配已知属性,就能大大缩小选择范围,在短时间内得出最有嫌疑的结果。 在这以前,警探们很难根据少量的破碎信息找出破案线索来的。该智能系统除了能有效提高办案效率外,关键是能做出实时犯罪预警。
在洛杉矶局的实时犯罪预警中心,有一电脑屏幕墙上显示着洛杉矶地区的电子地图,地图上正不停地闪烁着,每一次闪烁都代表着那个地区可能即将发生一次犯罪活动。公安指挥中心根据地图上的实时预警,及时向预警地区派遣警力,阻止犯罪。Palantir 为洛杉矶局提供的数据分析系统通过对过去大量的案件数据进行挖掘分析,能将一些看似不可能的信息关联在一起,得出隐藏在背后的重要破案线索。街道上大量的监控摄像头会将画面数据实时传入预警系统中,突发的新闻报道数据也被实时传入预警系统中,系统将监控摄像头画面与后台的人脸特征数据库匹配,再加上突发的新闻报道数据,最后会自动地实时预测出那个地区目前极有可能发生犯罪的嫌疑人。另外,系统还能从网络上数以亿计的匿名聊天信息中预测出潜在的犯罪活动,找出隐藏在背后的重要破案线索。 - 洛杉矶局是第一个跃进大数据时代,采取大数据公安警务模式的公安机构。它与数据分析公司 Palantir 合作建立了实时犯罪预警中心。Palantir 通过对社交网络中的海量数据进行挖掘分析,以追踪有关的信息情报,并在美军击毙的行动中为美军提供了重要的情报。
- 标签:生物学图库
- 编辑:王虹
- 相关文章