-
干货:数据仓库、OLAP和 数据挖掘、统计分析的关系和区别详解
所属栏目:[大数据] 日期:2021-06-05 热度:99
一、什么是数据挖掘 数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或挖掘知识。 干货[详细]
-
利用Pandas和SQLite增快超大数据的读取速度
所属栏目:[大数据] 日期:2021-06-05 热度:178
第一个方法:分块 来设想一个具体的示例:你要参加某个竞选,为此,你找到了一个CSV文件,里面包含你所在城市每个选民的信息。于是乎你派人去挨门挨户地拜访,邀请特定街道的所有登记选民参与投票。 现在,Pandas的DataFrame对象中有索引,但是必须要将数据[详细]
-
Apache HBase内核深度研究
所属栏目:[大数据] 日期:2021-06-05 热度:63
HBase相关算法与数据结构基础知识 跳跃表 暂时先不说跳跃表是什么,在Java里面有一个Map叫:ConcurrentSkipListMap,通过对HBase的源码跟踪,我们发现这些地方使用了它: Apache HBase内核深度剖析 简单的列了几个,但是观察这几个类所在的模块就可以发现,H[详细]
-
解决 Spark 数据倾斜的 8 大实用技巧
所属栏目:[大数据] 日期:2021-06-05 热度:66
什么是数据倾斜? 对 Spark/Hadoop 这样的分布式大数据系统来讲,数据量大并不可怕,可怕的是数据倾斜。 对于分布式系统而言,理想情况下,随着系统规模(节点数量)的增加,应用整体耗时线性下降。如果一台机器处理一批大量数据需要 120 分钟,当机器数量增加[详细]
-
带你了解搭建Hadoop运行环境
所属栏目:[大数据] 日期:2021-06-05 热度:162
Hadoop 是一个分布式系统基础架构,在大数据领域被广泛的使用,它将大数据处理引擎尽可能的靠近存储,Hadoop 最核心的设计就是 HDFS 和 MapReduce,HDFS 为海量的数据提供了存储,MapReduce 为海量的数据提供了计算。这篇文章主要就是介绍一下如何搭建一个 H[详细]
-
如何制定数据科学和人工智能职业生涯
所属栏目:[大数据] 日期:2021-06-05 热度:109
为了深入了解有关人工智能和数据科学专业人士的职业生涯规划,机器学习平台厂商DataRobot公司可信人工智能副总裁Ted Kwartler对此进行了阐述和分析。Kwartler也是哈佛大学的兼职教授,教授《商业数据挖掘》课程。 Kwartler说:数据科学家可以说是哈佛大学十[详细]
-
旺链科技刘涛:重点深入研究区块链在物理行业的应用,拓展行业应
所属栏目:[大数据] 日期:2021-06-04 热度:133
据了解,本次旺链展出了一系列解决方案。刘涛以VoneMall为例介绍道,如果我想送一个人礼物,那么把想要对他说的话直接写在贺卡上面是比较传统的方法。所以我们有[详细]
-
腾讯成立CSIG技术委员会,唐道生担任总裁
所属栏目:[大数据] 日期:2021-06-04 热度:193
腾讯云与智慧产业事业群(CSIG)宣布正式成立技术委员会,通过自上而下方式,构建更加适应产业互联网发展的技术文化,为人才提供良好的成长平台,为客户创造持久[详细]
-
戴尔技术集团宣布,其2022财年第一季度的收入同比增长12%
所属栏目:[大数据] 日期:2021-06-04 热度:112
戴尔科技集团公布了2022财年第一财季报告。根据财报显示,第一财季营收同比增长12%,达到245亿美元;运营利润同比增长96%,达到14亿美元;非美国通用会计准则下[详细]
-
FONE创始人曾晓丹:EPM是后ERP时代的重要管理工具
所属栏目:[大数据] 日期:2021-06-04 热度:144
在后ERP时代,更加强调财务管理部门在业务分析、预测,辅助经营决策等方面提供价值。而财务共享中心建设完成后,企业通过EPM这种标准化的流程财务作业,能够更好[详细]
-
无影云电脑发布3款新品 开始大规模商用
所属栏目:[大数据] 日期:2021-06-04 热度:78
阿里云总裁张建锋在演讲中透露,无影云电脑已服务众多行业客户,开始启动大规模商用。当天,无影云电脑公有云版上线,客户可以通过阿里云官网下单订购。 当天演[详细]
-
勇敢攀登世界科技高峰
所属栏目:[大数据] 日期:2021-06-04 热度:93
科技兴则民族兴,科技强则国家强。量子九章,神机妙算;天眼巡游,宇宙天边;北斗导航,全球组网;天问一号,着陆火星5年来,在党中央坚强领导下,我国科技创新[详细]
-
从“跑”到“引”,世界一流的水电设备源于“东方”
所属栏目:[大数据] 日期:2021-06-04 热度:194
吉林敦化抽水蓄能电站1号机组顺利进入15天考核试运行期,该机组启动调试用时之快,创造了国内同类型电站新纪录。各类优异的运行参数证实了东方电气集团东方电机[详细]
-
时空数据,助力未来——北斗产业新应用观测
所属栏目:[大数据] 日期:2021-06-04 热度:63
应用场景百花齐放 应用更广泛,成品更多元,是本届年会的一大亮点。基于北斗卫星定位系统高精度定位技术的加持,道路营运车辆实现亚米级定位精度,无人驾驶农机[详细]
-
盘石:计划投资贵阳,打造“西部直播之都”
所属栏目:[大数据] 日期:2021-06-04 热度:68
在2021中国国际大数据产业博览会期间,盘石集团董事局主席田宁在接受记者采访时这样表示。 盘石集团董事局主席田宁 其中,以盘石的直播电商云为例,田宁说,近两[详细]
-
SEC去年曾警告马斯克:你发的这条推文两次违反了规定
所属栏目:[大数据] 日期:2021-06-04 热度:175
6月2日早间消息,美国法院要求特斯拉CEO马斯克在发送推文时须得到公司律师的许可,尽管如此,去年SEC致信特斯拉,声称马斯克无视命令两次违反规定。2018年马斯克[详细]
-
特斯拉申请了新的商标,并正式计划进入餐饮业
所属栏目:[大数据] 日期:2021-06-04 热度:99
6月2日消息,据报道,美国专利商标局网站显示,特斯拉已经为其餐饮服务申请了新商标,预计这家电动汽车制造商将扩大充电基础设施周围的便利设施,包括实体餐厅。[详细]
-
年收入不到20亿美元的核心之旅公司如何卡苹果、三星、华为、高通
所属栏目:[大数据] 日期:2021-06-04 热度:72
从2020年至今,ARM一直处于风口浪尖,先是传出ARM和ARM中国的换帅风波;后有英伟达官宣收购ARM,这引起全行业抵抗、不满。 进入2021年,将整个IT世界搅得不安的A[详细]
-
AirPods不支持的“无损音乐”,苹果为什么要推
所属栏目:[大数据] 日期:2021-06-04 热度:176
苹果产品强调轻[详细]
-
推荐网络安全投入占比 提高至15%以上
所属栏目:[大数据] 日期:2021-06-04 热度:130
我国已经进入新发展阶段,处于数字技术革命的加速期,网络安全是数字时代的底板工程,没有网络安全,数字技术的作用会大打折扣。在政协北京市第十三届委员会第四[详细]
-
挫折虚假信息、虚假流量等
所属栏目:[大数据] 日期:2021-06-04 热度:161
国家网信办1月22日发布新修订的《互联网用户公众账号信息服务管理规定》,自2月22日起施行,重点强调打击虚假信息、虚假流量等违法违规行为。 对比2017年10月8日[详细]
-
即墨区出台新政赋能工业互联网发展
所属栏目:[大数据] 日期:2021-06-04 热度:68
日前,为深入实施工业互联网发展战略,加大工业互联网发展支持力度,《青岛市即墨区人民政府关于支持工业互联网发展的意见》发布,按照该《意见》,即墨区企业进[详细]
-
网络自动化助力运营商SDN投资持续到2024年
所属栏目:[大数据] 日期:2021-06-04 热度:148
2020年的carrier SDN采用情况 经过近十年的技术创新、概念验证和商用实施,carrier SDN的好处是众所周知的。carrier SDN的目标是使尽可能多的网络元素和流程实现[详细]
-
杀熟只是个起头,大数据违法成本过低
所属栏目:[大数据] 日期:2021-06-04 热度:143
爆炸性增长的数据带来了价值增长地带,合理利用数据诚然可以提升企业运行效率。但是大数据这把双刃剑向内的剑锋已经开始闪烁寒光。杀熟之类的数据隐私买卖频繁出[详细]
-
联邦学习首个国际标准正式推出!
所属栏目:[大数据] 日期:2021-06-03 热度:50
2018年年底,国内学术界与产业界在隐私计算领域开始了一场基于联邦学习技术的生态建设持久战。 那年12月,IEEE标准委员会(SASB)批准了由微众银行发起的关于《[详细]
