公司动态
行业最新新闻公司动态发布
数据科学热门技术 top 10
2016-05-13
原文作者: VincentGranville  本文由畅融金服运营组编译,欢迎转发,但请注明出处“畅融金服”。4月份,GilPress在《福布斯杂志》上发布了一个大数据十大热门技术的列表。其中列举的10项技术分别为:预测分析技术(Predictiveanalytics)NoSQL数据库(NoSQLdatabases)搜索和知识发现(Searchandknowledgediscovery)流分析技术(Streamanalytics)内存数据结构(In-memorydatafabric)分布式文件存储(Distributedfilestores)数据可视化(Datavirtualization)数据集成(Dataintegration)数据准备(Datapreparation)数据质量(Dataquality)同时,该文还附了一幅精美的图表。抛砖引玉,你认为的最热门技术是什么?你同意Gil的技术列表吗?就我个人而言,我认为与数据科学相关的技术中,以下8项技术最为热门:在分布式结构中应用现代预测算法AI(模式识别)深度学习(AI与机器学习的交叉应用)数据科学自动化传感器数据应用(IoT)非结构化数据转化为结构化数据,数据标准化多维预测模型融合应用HPC(高性能计算)分析密集数据和模型模拟(蒙特卡洛或贝叶斯方法),研究天气等复杂系统
畅圣大数据成为上海大数据联盟会员单位
2016-05-06
2016年5月,经过上海大数据联盟的审核,畅圣大数据正式成为该联盟会员单位。此举标志着,畅圣大数据作为国内领先的大数据金融服务企业,积极响应国家和上海市对大数据应用和产业发展的部署,在行业影响力、产品服务水平、业务创新能力等方面获得了上海大数据联盟和业界的充分认可。上海大数据联盟于今年4月初刚刚揭牌成立,是在上海市经济和信息化委员会、上海市科学技术委员会联合指导下,聚集大数据领域相关的数据资源、服务平台和数据应用等主体机构自愿组成的非营利性联合体。联盟以上海创建“全球科技创新中心”总方针为指导,按照“融合创新,服务示范”的宗旨,实现大数据技术和产业领域“传播、智库、金融”等三大平台服务功能,落实上海市大数据产业发展和技术创新的具体工作要求,围绕大数据技术链、产业创新链,实现产学研用等机构在战略层面的有效结合,通过资源共享、协同行动和集成发展,形成产业核心竞争力,有效提升上海大数据关键技术创新水平,推动大数据应用和产业发展。畅圣大数据创始人&CEO毛骏畅圣大数据创始人&CEO毛骏表示,“上海大数据联盟是上海市大数据发展‘交易机构+创新基地+产业基金+发展联盟+研究中心’五位一体规划布局中的重要一环,畅圣大数据很荣幸能够成为联盟成员。今后,畅圣大数据将继续充分发挥自有大数据分析算法和优质数据源的优势,在‘国家大数据战略’的引领下,积极研发大数据关键技术,不断拓展大数据应用场景,努力提升大数据服务效能,以营造良好大数据技术应用产业环境为己任,为国家供给侧改革和上海市建设具有全球影响力的科技创新中心作出积极贡献。”
互联网金融回归金融本质,必须设门槛
2016-04-27
部分平台企业问题接连爆发引起社会关注,近期,针对互联网金融的专项整治工作逐步展开,行业有望从鱼龙混杂走向正本清源。上海市互联网金融行业协会秘书长王喆接受解放日报·上海观察记者专访时指出,鼓励创新,但不纵容野蛮生长、问题寄生,是对这个行业的基本态度。他介绍,目前,上海范围内互联网金融行业总体是规范的,协会会员中没有出现过“跑路”的恶性事件。上海市互联网金融行业协会秘书长王喆上海互联网金融行业总体向好眼下,阿里、百度、万达等国内互联网行业巨头和其他领域知名企业,纷纷将其互联网金融业务板块布局上海;同时,交通银行、平安集团等大型持牌金融机构,也在沪搭建、布局互联网金融业务平台,还有众安在线、证通公司等新型互联网金融机构不断涌现。王喆介绍,上海市互联网金融行业协会现有200余家会员,已包含沪上该行业中的大部分企业。这其中,P2P网络借贷的企业占到了相当数量。此外,还有第三方互联网支付、互联网基金销售、金融资讯服务、互联网征信、互联网股权融资等各类互联网金融业态。“从面上看,有问题的企业很少,大部分平台的管理是规范的,会员跑路现象没有出现。”他指出,目前上海的P2P经营也相对规范,出现问题较少。王喆指出,总的来说,互联网金融的发展,是顺应我国市场经济发展的需要,也是对金融体系的一种有益的补充,也有利于我国金融市场改革。对于普通老百姓、小微企业等原来未能从大型金融机构获得充分服务的群体来说,互联网技术的发展,创新地满足了他们的需求。发展过快,监管有空档在总体规范、稳定的同时,王喆坦言,发展过快、监管缺失,确实给互联网金融行业带来了一些难以忽视的问题。对一个行业包容创新、鼓励发展,势必就会发展速度很快,而在这个快的过程中,如果相应的合规监管的配套政策环境没有快步跟上,伴生而来的就是乱象和问题。在鼓励创新的氛围中,近年来互联网金融的发展速度是惊人的。从所谓的互联网金融元年2013年到2015年,全国有数据统计的该大类企业有三四千家。数量爆发式增长的背后,是这个行业中没有准入制度,没有严格的从业资格要求,也缺乏明确的监管管理办法乃至法律。发展过快、监管缺失,好比没有把门的入口,鱼贯而入的从业者和从业机构之中,必然混入了那些钻空子的。“严格说,他们不是真正的互联网金融企业,而是打着互联网金融创新旗号、行诈骗之实”,“伪创新”、“真骗子”,污染了整个行业的名声,也累及了规范经营的企业,这让王喆感到痛心,“最近爆发出的很多问题,并不是真正的互联网金融或P2P,只是把古老的诈骗把戏搬到了网络上,却让整个行业‘很受伤’。”在王喆看来,庞氏骗局这个“老把戏”,披上了互联网的外衣,“如果整治时,把孩子和脏水一起泼出去,就可惜了。”回归金融本质,必须设门槛王喆指出,互联网金融,本质上还是金融。金融的本质是为有富余资金的一方和缺钱的一方,提供融通服务,起到媒介作用,以及相关的服务等。他往往会涉及到一方的钱财,因此从业人员对法律,道德的敬畏程度很重安,或者说不是什么人都可以干的,要有准入条件。同时他认为,这个过程中,三方要取得收益,关键取决于借钱方,是否有真正的经济行为,因此,金融必须服务于实体经济,“没了实体经济,金融就没有灵魂,脱离了实体经济,金融就是自娱自乐了。” 当前,频频爆出问题的平台中,一类是一开始就故意诈骗,虚构的收益表象背后根本不存在实体资产运作的支撑,那是道德问题,是缺乏门槛“混”进来的。另一类则是经营不善,导致资金断链,这与实体经济环境有关,也有能力问题,而平台实力和能力,也是需要门槛把关的。上海在对互联网金融的监管与自律方面起步较早,在规范发展方面走在了全国前列。这得益于市政府和金融监管部门领导和重视。据介绍,协会对于会员的遴选相当严格,先是综合考虑企业的成立时间、实缴资本、股东背景、业务模式、风控水平和线下网点数量等因素,再从一些侧面进行考量,如广告投入是否过高、承诺收益是否过高等。别在处理风险时酿成新的风险当前,业界的中肯意见认为,受国家产业调整、国际环境、汇率变化、经营决策等多种因素影响,规范经营的平台也可能会有风险的。对于这类情况,如果听任危机扩大、动摇信心,造成的挤兑等“次生伤害”可能影响更大。“希望不要在处理风险的时候酿成新的风险。”王喆认为,行业协会一方面可以发挥行业自律的作用,开展从业者教育,引导会员坚持道德底线,坚持守法经营,加强行业自律。据悉,协会也将开设讲座,请风控能力较强的企业进行经验分享,树立正面典型,并将一些风险、跑路案例作为反面教材,进行重点分析。同时探索建立从业人员黑名单,在行业内信息共享,将道德水准低下的人员排除出这一行业。此外,行业协会还在考虑建立行业的“应急基金”,应对突发的危机风险。另一方面,行业协会也可以搭建起行业与政府、社会、传统的银行等之间沟通的桥梁,帮助规范经营的互联网金融平台更好地运营。比如,一些社会需要、传统金融机构顾及不了的项目融资需求,可以协调这些平台去做。又如,协会可以通过沟通协调,推动互联网金融行业内平台整合,避免同行之间恶性竞争。而对于平台上的投资者,行业协会也计划扩大投资者教育,让他们学会对收益的恰当追求,学会对风险有理性判断,加深“买者责任自负”的理念。协会也有责任向社会宣传,怎样的平台才是真正好的互联网金融企业,要为好的企业摇旗呐喊,进行正向引导。“总而言之,互联网金融行业即将结束野蛮生长,走向更加良性、健康、规范、有序的发展。希望互联网金融行业协会可以做深做透这些接地气的工作,力保不发生系统性的风险。”王喆表示,近期针对互联网金融行业的整顿恰逢其时,希望此后,各方可以协力探索出一条适合中国互联网金融发展的行之有效的监管体系,营造一个互联网金融发展的良性生态环境。本文转自:上海观察
《大数据百科》一文详解大数据发展史
2016-04-22
【1890年】美国统计学家赫尔曼·霍尔瑞斯为了统计1890年的人口普查数据发明了一台电动器来读取卡片上的洞数,该设备让美国用一年时间就完成了原本耗时8年的人口普查活动,由此在全球范围内引发了数据处理的新纪元。【1935年】美国总统富兰克林•罗斯福利用社会保障法开展了美国政府最雄心勃勃的一项数据收集项目,IBM最终赢得竞标,即需要整理美国的2600万个员工和300万个雇主的记录。【1943年】一家英国工厂为了破译二战期间的纳粹密码,让工程师开发了系列开创性的能进行大规模数据处理的机器,并使用了第一台可编程的电子计算机进行运算。【1944年】《学者与研究型图书馆的未来》一书出版。作者弗莱蒙特·雷德预计美国高校图书馆的规模每16年就翻一番,到2040年耶鲁大学图书馆将拥有约2亿册藏书。【1961年】《巴比伦以来的科学》一书出版。作者德里克·普赖斯经过研究得出“指数增长规律”,即新期刊的数量正在以指数方式增长,每15年翻一番,每50年以10为指数倍进行增长。【1964年】《应对信息爆炸的技巧》一文在《电子计算机学报》上发表,该文提出了通过压缩新论文篇幅和减少论文发表量来解决信息爆炸的建议。【1965年】美国政府一项秘密研究计划将所有政府记录进行格式转换——包括7.42亿条税单和1.75亿套指纹-—转换为磁式计算机磁带存放在唯一的国家数据中心,尽管该计划后来因为遭受公众抗议而被取消了。该计划激发1974年的隐私法案,这一法案限制了联邦机构分享个人信息的行为。【1967年】《自动数据压缩》一文在《美国计算机协会通讯》上发表,文章指出信息爆炸使得对所有信息的存储需求保持在最低限度是非常必要的。并提出全自动数据压缩机的构想。【1975年】日本邮电部实施“信息流普查”计划,以调查日本的信息总量。普查以“字数总量”作为所有媒体的统一衡量单位。【1980年】特鲁姆斯兰德在第四届美国电气和电子工程师协会(IEEE)举办的“大规模存储系统专题研讨会”上做了一个报告,题为《我们该何去何从?》,报告指出因为很多数据无法被用户识别,而丢弃这些数据存在着很大的风险,因此数量庞大的数据正在被保留下来。【1981年】匈牙利中央统计办公室开始实施一项调查国家信息产业的研究项目,该项目包括以比特位单位来计量信息量。【1983年】伊契尔·索勒·普尔在《科学》杂志上发表了《追踪信息流》一文,通过对1960年到1977年17种主流通讯媒体发展趋势的观察得出结论,在1977年以前,信息流的增长速度在很大程度上受到广播迅速发展的影响,而到了1977年,点对点的媒体发展速度明显优于广播。【1986年】哈尔·B·贝克尔在《数据通信》上发表了《用户真的能够以今天或者明天的速度吸收数据吗?》一文,文中预测到2000年,半导体随机存储器将能够在每立方英尺存储1.25*1011个字节。【1989年】英国计算机科学家蒂姆·伯纳斯·李在20世纪60年代提出通过开创了一个叫做万维网的超文本系统在全球范围内利用互联网实现共享信息。【1997年】迈克尔·考克斯和大卫·埃尔斯沃斯在第八届美国电气和电子工程师协会(IEEE)举办的“关于可视化”的会议上,发表了《为外存模型可视化而应用控制程序请求页面调度》的文章,文中写到,可视化对计算机系统提出了一个有趣的挑战:通常情况下数据集相当大,耗尽了主存储器、本地磁盘,甚至是远程磁盘的存储容量。我们将这个问题称之为大数据。【1998年】《互联网的规模与增长速度》一文发表,作者预计在2002年左右,美国的数据流量将赶超声音流量,且将由互联网主宰。【1999年】《千兆字节数据集的实时性可视化探索》在《美国计算机协会通讯》上发表,文章第一次正式使用“大数据”这一术语。【2000年】《信息知多少?》一文第一次对世界上每年在计算机存储方面做了量化研究。【2001年】道格·莱尼发布了《3D数据管理:控制数据容量、处理速度及数据种类》的研究报告,首次提出“3V”作为定义大数据的三个维度。【2002年】在9/11袭击后,美国政府为阻止恐怖主义已经涉足大规模数据挖掘。前国家安全顾问约翰·波因德克斯特领导国防部整合现有政府的数据集,组建一个用于筛选通信、犯罪、教育、金融、医疗和旅行等记录来识别可疑人的大数据库。【2004年】Facebook公司成立,以此为标志社交网络流量直接导致大量非结构化数据的涌现,而传统处理方法难以应对。【2005年】Hadoop项目诞生。Hadoop其最初只是雅虎公司用来解决网页搜索问题的一个项目,后来因其技术的高效性,被ApacheSoftwareFoundation公司引入并成为开源应用。Hadoop本身不是一个产品,而是由多个软件产品组成的一个生态系统,这些软件产品共同实现全面功能和灵活的大数据分析。【2006年】一种名为云计算的新工具出现,云计算不仅可以开采新型的数据资源(非结构化数据),而且还发掘出了一些重要的新用途(如精准营销、趋势预测等)。最重要的,这种工具的成本非常低廉。【2007年】《膨胀的数字宇宙:2010年世界信息增长预测》白皮书出版,这是第一份评估和预测每年世界所产生与复制的数字化数据总量的研究。【2008年】“大数据”得到部分美国知名计算机科学研究人员的认可,业界组织计算社区联盟(ComputingCommunityConsortium),发表了一份有影响力的白皮书《大数据计算:在商务、科学和社会领域创建革命性突破》。它使人们的思维不仅局限于数据处理的机器,并提出:大数据真正重要的是新用途和新见解,而非数据本身。【2009年】联合国启动了“全球脉动计划”,拟通过大数据推动落后地区的发展。【2010年】《数据,无所不在的数据》一文在《经济学人》上发表。作者肯尼斯·库克尔描述,世界上有着无法想象的巨量数字信息,并以极快的速度增长。从经济界到科学界,从政府部门到艺术领域,无不感受到这种巨量信息的影响。【2011年】IBM的沃森超级计算机每秒可扫描并分析4TB(约2亿页文字量)的数据量,并在美国著名智力竞赛电视节目《危险边缘》“Jeopardy”上击败两名人类选手而夺冠。后来纽约时报认为这一刻为一个“大数据计算的胜利。”2012年美国政府提出“大数据研究和发展倡议”,发起全球开放政府数据运动,并投资2亿美元促进大数据核心技术的研究和应用。【2012年】瑞士达沃斯召开的世界经济论坛上,大数据是主题之一,会上发布的报告《大数据,大影响》(BigData,BigImpact)宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样。【2012年】美国软件公司Splunk于19日在纳斯达克成功上市,成为第一家上市的大数据处理公司。【2014年】欧盟委员会呼吁各成员国积极发展大数据,迎接“大数据”时代,并采取一系列具体措施发展大数据业务。【2015年】全球通过手机或移动装置接入互联网的用户超过了通过电脑或者笔记本接入电脑的用户。这种用户习惯的改变对于App设计人员、公司甚至政府如何收集数据都会产生巨大的影响。
共 7 页
到第