全球最牛的28个大数据可视化运用事例(三)资金喷泉担保圈毒刺-亚洲ca88官方网站

发布时间:2023-03-18 22:26:47 来源:亚洲ca88官方网站

  原标题:全球最牛的28个大数据可视化运用事例(三)资金喷泉/担保圈毒刺/

  跟着大数据在人们作业及日常日子中的运用,大数据可视化也改变着人类的对信息的阅览和了解办法。从百度迁徙到谷歌流感趋势,再到阿里云推出县域经济可视化产品,大数据技术和大数据可视化都是暗地的英豪。今日,咱们将连载由Teradata独家供给的来自全球28个大数据可视化运用事例第三部分。

  本系列4篇文章为36大数据独家专稿,任何不标明来历36大数据和Teradata以及本文链接的转载均为侵权。大众号也是如此。

  这个匿名的可视化是剖析的一系列映射在我国大型企业之间的资金活动量的联络,这是一家我国大型银行的企业银职事务的风险剖析项目之一。剖析运用转账买卖数据以了解风险和发现商场时机。

  在此图中点 (节点) 代表公司。线 (边际) 代表两家公司之间的资金搬运和箭头显现这笔钱流向。

  图表显现了不同的公司之间的一切金钱活动。咱们能够将映射经过 2、 3 和 4 的后续买卖,如绿色公司了解上游供应链的活动和对彼此彼此依靠性的公司。

  若要处理风险,银行需求辨认于高度彼此依存的公司。它答应银行确认要害的公司在供应链和独立穿插查看公司的现金流来验证其资金的健康状况。

  它还有助于辨认诈骗。银行能够查看公司的实在的商业活动,并能够验证借出的资金用于其意图。例如制造商,是出资在股票商场的投机资金,而不是向供货商付款或谁拿出一笔借款建一座工厂,但实在地将资金用于短期住所房地产买卖。

  它还有助于商场营销,它强调了银行服务方面的距离。其间许多的资金流出 (或) 到的链标识高价值远景公司。它为现有的客户端提醒了在融资、 结算、 风险处理等更广泛金融服务的服务供给更高的价值。

  这种剖析运用 Teradata Aster和 Aster 的Lens。装载的买卖数据是非常大的, 包含超越 670,000 公司的 60,802,990 记载。公司记载包含职业分类代码,因而咱们能够了解他们的事务活动。这张图包含 PageRank 用于挑选尖端的32 个重要客户和咱们包含一切相关的买卖对手方总买卖大于或等于到达人民币 70 万元(USD$ 115 k)。

  在此图中有 3883 节点和 3943 条边。节点代表公司,而边代表公司之间的现金流,箭头显现这笔钱流向。

  石棋玲(Mary) 是现已在我国测验运用高强度超级图形办法的大规划风险剖析的数据科学家和开辟人。她与我国的银行结成伙伴联络的方针是要揭开我国高度杂乱的商业体系中处理风险的新办法。她的作业包含”资金喷泉”是一系列的立异,协助消除金融体系中的风险仅仅其间一例。 她充溢天分, 会在银行金融运用方面有更宽广的国际。

  石棋玲现在是Teradata我国 的高档参谋,是Aster & Hadoop 大数据杰出 (COE)中心的一员。石棋玲于2009年在中心佛罗里达大学获得运用数学博士学位。她现在正在职读美国德拉维尔大学的MBA学位。在 Teradata 之前, 她在美国匹兹堡的 PNC 银行的风险处理部分作业 2 年以上。那段时刻,她开发了许多算法来操控风险和冲击诈骗和洗钱 ;其间几个算法曾呈现在美国钱银操控委员会的陈述中。她在美国计算机科学公司作业时开发了许多计算机程序并在多个国际SAS 会议上宣布。

  这一数据可视化选用了1000个基因工程的数据,显现出不同人群及地理方位基因的改变(和类似性)。

  每个结构都显现出1000个基因工程中一个不同的集体或许地理方位。每个结构都是由纯基因数据构建成。调查者能够清楚地看到不同集体的改变,证明了大规划的基因数据有助于明确地了解全球各个地理方位的集体。

  项意图方针在于证明大规划基因剖析的价值。大规划基因剖析运用高强度超级成像法更好的了解癌症的基因遗传形式,及怎么开宣布与个其他遗传基因成分匹配的个性化医学治疗法。

  这一可视化经过VizExplorer 显现了一批量子超级图画的调集,在Teradata相关的数据库之上运用查询叠加进行大规划数据处理。

  大规划数据处理开端选用量子树算法,经过运用一种数据库内的递归算法,将1000个基因集体的悉数方位信息置于一个常见的分层量子网格中处理。然后,一个数据库查询被用于为每一个相应的集体的总人口构建数据子集。数据子集继而可用以构建一幅热力求,显现在每个结构上。

  终究各结构集合一同组成一幅“小倍数”图画,这样可在1000个基因项目全体中调查出各集体间序列数据的形式。基因数据规划非常巨大:一个包含25000个肿瘤的数据库就意味着超越75兆数量的数据记载。

  安德鲁是VizExplorer公司首席技术官。他具有奥塔哥大学测量学学士学位,并获取了维多利亚大学计算机科学学位。他经过练习成为一名制图师,在制图、数据可视化、高性能的数据库规划范畴创造了超越60项专利和创造。在数据可视化相关的信息技术范畴,他和他的团队两度成为史密森学会奖的英豪主义得主。安德鲁还参加合著了一本数学游戏剖析方面的书,以及60多篇数据可视化及高档剖析范畴的文章。安德鲁身世并成长在新西兰南岛。现在,他和他的妻子及4个孩子一同住在美国加州。

  宝立明是Teradata公司首席技术官。 他结业于麻省理工学院计算机科学专业,他的硕士和博士研讨集中于高性能并行处理。他还完成了由哈佛大学商学院和麻省理工斯隆处理学院合办的工商处理课程与论文作业。在巴拉克.奥巴马初次任期期间,他还曾被任命为“总统科技参谋委员会”(PCAST)的一员,服务于“网络与信息技术研制”作业小组。近期,由Exec Rank从10000多名美国首要首席技术官里做出的排名中,宝立明名列第4(前3名为亚马逊网CTO、特斯拉轿车CTO,以及英特尔CTO)。

  宝立明是数据狂,安德鲁是视觉化狂。他们二人同在“数据仓库研讨所”和其他论坛里教育高档数据可视化长达10多年。包含在这个课程的便是针对基因组学超级图画的深度测验。宝立明和安德鲁还同是户外运动的疯狂喜好者,他们在新西兰和美国常一同出外背包游览。

  ‘担保圈火花’ 展现了在某家银行的轿车厂商、4S店和个人客户之间树立的担保联络网络.这是担保圈剖析的其间一个图形。

  制造商和零售商早就知道给客户供给消费借款来促进出售的优点。轿车职业的竞赛越来越剧烈,在全球最大的轿车商场我国也不破例。为了更好的争夺客户,许多轿车金融公司和4S店为客户请求轿车消费借款,一些手头窘迫的顾客轻松完成购车愿望。

  在这个隐去姓名的图形中,点代表车贷客户或许车贷担保人,线代表担保人和被担保人的担保联络.不同色彩用来区别相应的担保网络。

  从图形中的这些火花开放,咱们能够很简单看到黄色、蓝色和紫色的集体,这其间几个担保人为许多借款供给担保。这些担保人有些是轿车公司或许是企业法人。在有些情况下,像蓝色和紫色集体,不同的相关实体作为担保人,这样就很难发现整体的风险露出。

  银行能够针对这些风险露出采纳办法。或许不是那么直接,该图仅仅该系列的其间一幅。银行首要要做的是避免多米诺效应。在许多情况下,这些轿车厂商和4S店是银行的优质客户,银行出于保护客户联络,扩展事务范围,进步客户黏度,为此处理车贷事务,但相应的车贷风险仍是要做好监控和处理。

  ‘担保圈毒刺’ 是一系列银行风险处理剖析中的一个效果输出。它提醒了对公客户借款组合的精心策划的带有利诱和诈骗的担保行为。这是Teradata在我国开发的一些大数据风险处理技术的一部分。

  它是着眼于公司客户担保事务的,某家公司为其他公司供给担保,向银行请求借款。一般情况下,只凭仗被担保公司的资质是无法获得相应借款的。

  问题来了,当公司客户彼此担保,比如说,A作为B的担保人请求借款,然后B做为A的担保人请求借款。这样,一切的风险就会转嫁给银行。一旦A或许B呈现违约,会触及到这两家公司的借款,风险露出会成倍添加。1对1的彼此担保非常简单发现,但假如这个担保圈比较大,或许假如公司结构比较杂乱,借款就会给到不同的分公司,不同的省公司,乃至不同国家的公司呢?

  在这个隐去姓名的图形中,咱们把彼此担保的公司给分隔。点代表一个公司,担保人或许被担保人。线代表担保人和被担保人之间的联络,线的粗细代表担保金额的巨细。

  像丧命的水母或许潜藏在大海深处的毒刺,‘担保圈毒刺’ 提醒了错综杂乱的互保网络,每个担保网络触及数百万乃至亿级的借款金额。借款批阅部分能够开端翔实的拆网方案以下降银行风险,让金融体系愈加安全。

  ‘担保圈之谜’ 提醒了房地产开发职业所发生的潜在风险。首要房地产公司是银行的重要客户,开发住所需求银行的资金支撑,房子建成后,银行给购房者供给住所典当借款,延伸和拓宽了银职事务,一同,协助房地产公司出售产品。

  房地产的黄金年代现已曩昔,未来我国的房地产价格在不同区域会呈现分解。一二线城市住所地产需求旺盛,价格坚硬,三四线城市商场低迷,部分区域价格下滑,出售不畅。为了促进出售,部分隔发商为购房者供给担保,下降购房门槛,低首付重现江湖,为的是去库存。我国经济处在转型阶段,有些职业呈现必定的风险,而身在筛选落后产能的购房者呈现断供的或许性在添加,别的,假如一同房地产价格呈现下滑,不以寓居为意图的炒房者,这些房贷的风险也会进一步添加。房地产公司作为担保人,他们未来的风险需求防备。

  从银行的视点讲,每个房贷是依照每个购房者的资质来批阅。每个人的房贷,假如由房地产公司担保,本身的风险并不大,但假如房地产公司为许多人供给担保,很或许是房子没有卖出去,制造一种虚伪出售,套取银行借款,那这样的风险就要严加防备。

  这个隐去姓名的图形让银行看清房地产开发商和房贷客户的担保联络。每个点代表房地产开发商或许房贷客户。线是房地产开发商和房贷客户之间的担保借款。不同色彩能够区别不同担保网络。你会看到一些房地产开发商为许多的客户供给借款的担保。

  ‘担保圈之谜’ 让银行展现和监控风险露出的规划和实在的特性。银行能够对高风险客户采纳办法,这些办法包含收紧借款批阅,乃至回绝借款。

  担保圈火花、担保圈毒刺、担保圈之谜 3副数据可视化图片著作的作者均为 张玉瑞

  张玉瑞是大中华区大数据事业部华东区的高档参谋。他是Teradata我国区数据科学家团队的重要成员,协助客户运用大数据剖析手法来处理风险处理和商场营销方面的事务问题。

  他结业于上海交通大学通讯与信息体系专业,获工学硕士学位。他在数据剖析范畴有10多年的作业阅历,专心于银职业、保险业和电信业。他酷爱数据剖析,并为此付出了许多的尽力。

  刚结业,他做为咨询参谋参加了SAS我国,在统计剖析和传统数据发掘方面积累了丰厚的阅历。后来大数据年代降临,他参加Teradata,致力于运用Aster剖析探究渠道进行大数据剖析。他与Teradata我国区的数据科学家其他团队成员一同协助客户运用新的大数据剖析办法来发现事务价值。

  他现在上海作业,喜爱旅行的他,先后去过美国、法国、德国、意大利和瑞士,对异国文明充溢猎奇。他喜爱运动,喜好游水、羽毛球、网球。

  欢迎来到“中介大数据”的国际。在这个国际里,挖苦地是,大数据将被用于下降成本和优化大数据本身。

  假如你能够看到一个大型的归纳数据库(IDW)里边,你会发现那是一个由数百万彼此相关的数据元素和方针交织成的巨大网络。在一个归纳数据库每天加载数据时,成百上千的方针将在一个细小却精心规划的处理链上彼此作用,并将越加彼此相关严密。在此进程中,数据被转化、整合,并生成出终究的用户视图和陈述。

  那很棒,可是,假如你想要减缩数据库加载时刻,优化剖析生态体系中的数据存储,或许想转到一个双活性体系时,那该怎么办呢?

  创始“元数据科学家”保罗.丹瑟提出了这一无名的可视化办法。在Teradata 数据库一个很大的产品继续近20年的开展前史中,这个可视化第一次显现出数据方针网络的彻底杂乱性。金点(节点)显现数据库方针,灰线(边际)显现他们彼此的依靠性,因而咱们能够看见那些细小而彼此相关的进程链。大块密布集体是中心的、整合的数据结构,外侧分散的岛屿则是集市。

  可视化让咱们能够看到,一切细小的进程链都是彼此依靠,且按次序排列的。因而,它便是优化IDW最好的东西。其图表能够被用来决议双活性挑选,并能在没有依靠风险下,针对数据库方针次序进行细节规划和布置。该可视化还能够揭露出许多各式各样的非正式遗产“提取转化与加载”形式(ETL),这些形式对优化新的加载和转化程序非常的反常与风险。

  预订的Java运用曾经过获取图形进行可视化,递归式地从每个方针中提取“数据界说言语”(DDL)。其方针均起始于Teradata数据库层次结构中的一个根。每个界说作为替补参阅方针被查找,并匹配一个形式,然后在内存中根据一个完好的数据库方针进行验证。一旦确认有用,“极点”或许“节点”与“边际”联络将会被参加“有向非循环图”方针中。

  别的,一个方针列表也会输出指定一个有用的次序布置。次序是经过“拓补排序法”在图上决议的。有用的次序布置有许多种。

  Teradata体系配置的加载最小化,运用Java运用在客户端进行文本模型匹配和图形处理。

  保罗是Teradata企业架构咨询师。曩昔10,他在英国支撑Teradata公司客户,最近又转到澳大利亚。他是“元数据科学家”创始小组的一员,现正致力于一起开发新的大数据技术,在杂乱巨大的剖析生态体系中,促进数据存储和数据处理形式优化。

  保罗在英国斯旺西大学获得商业科学学士学位,并曾在英国钢铁公司、通用电气公司和凯捷集团上任。他对经过元数据进行代码生成、正向和逆向工程抱有持久的热心,在Teradata的悉尼专业服务实践中被点评为处理疑难杂症的“百晓生”。在不久的将来,跟着新技术的选用和剖析生态体系日渐杂乱,他将在“中介大数据”方面具有巨大的潜力。

  这张可视化图表强调了一些要害的社会问题,这些问题是英国慈悲安排巴特尔的社会作业者们指出的,它们导致了问题儿童的发生。这张图片总结了社会问题和孩子们的需求之间的杂乱联络。例如,它指出家庭暴力、贫穷、和孩子的健康问题并不是独自呈现的,而是一些高度相关的论题,它们一起致使英国的家庭陷入困境。

  这些圆点(节点)代表了作业人员们说到的社会问题,圆点的巨细则代表这些问题使家庭陷入困境的或许性;这些线代表了相关或并发事情;调查者们能够清楚地看到各个家庭间类似的阅历。英国巴特尔安排必定了这种类似性,而且了解这些阅历是怎么与上述论题联络在一同的。

  英国巴特尔慈悲安排的方针便是经过与一线安排的协作协助英国最软弱和孩子和家庭,该安排经过补助金为孩子、年青人和他们的家庭供给直接的经济援助。

  该方案旨在了解软弱家庭的需求、特别是孩子和年青人的需求;该慈悲安排期望经过此方案找到一个办法,能为这些人供给更适合他们的服务。一同,该慈悲安排也期望经过辨认那些会对家庭形成影响的要素,并由此形成对社会需求的更充沛的了解。这一方针协助该安排更好地猜测其方针服务人群在当时和未来的需求,然后协助他们相应地进行方案作业、供给服务。

  这张可视化图表展现了运用Teradata Aster 发现渠道中的Aster滤镜东西制造的西格玛图。巴特尔的作业人员所做的记载被输入Teradata Aster渠道后,事例作业人员会运用文本剖析技术剖析他们的笔记、发现要害词和重要短语。其间所运用的文本剖析功用包含:符号化,nGram,词频逆和文档频率剖析。

  接下来,每个作业人员作业文档里的要害词和短语会经过文件协同过滤的办法被进行剖析。这些技术辨认的问题一般会在同一文档中重复呈现,因而呈现出很高的类似性。

  而这幅西格玛图则用于展现各社会问题之间的类似性。图表中的每个节点都代表一种社会问题,节点间的定向链接则用来描绘社会问题间的依存联络,而且将类似性的指向数量化。

  Yasmeen是Teradata的最有构思和有见地的数据科学家之一。 Yasmeen在苏格兰长大,她喜爱户外活动,尤其是在苏格兰Munros山和在海上划皮艇。

  她在许多国家作业过,包含英国、爱尔兰、荷兰土耳其、比利时和丹麦,她包含了金融,电信,零售和公用事业等职业。 Yasmeen专精与企业协作以确认他们的应战,并将其转化为剖析布景。她专心于企业怎么运用新的或没有开发的数据来历,沿着新技术以进步本身的竞赛才能的共同才能。

  Yasmeen现已与许多剖析团队作业,供给领导,训练,辅导和实践的支撑,供给可操作的见地和运营效果。她运用各种剖析办法,包含文本剖析,猜测建模,归属战略和时刻序列剖析的开展。她深信可视化的力气使的在企业用户能够简单进行杂乱的交流。

  在Teradata之前,Yasmeen在生命科学职业作业作为数据科学家,建造杂乱、多维数据剖析管线。 Yasmeen还持有数据处理,发掘和可视化,这是进行在威康信任中心的基因调控和表达的博士学位。她在国际上宣布了多篇论文并在国际会议和活动中讲演。此外,她还在MSc教有关科学数据和商业智能硕士课程。

  Yasmeen关于数据剖析和可视化有敏锐的热心,经过她的研讨中一向猎奇地问问题并了解更多信息。这些技术现已答应Yasmeen探究多学科的时机,为她供给了新的无尽的应战!

上一篇:【数据可视化事例】精于内华于形 下一篇:才智城市数据可视化大屏展现的事例
分享到: