-
视音频数据处理入门:UDP-RTP协议解析
所属栏目:[大数据] 日期:2020-12-26 热度:138
http://blog.csdn.net/leixiaohua1020/article/details/50535230[详细]
-
数据处理的统计学习(scikit-learn教程)
所属栏目:[大数据] 日期:2020-12-25 热度:118
副标题#e# 数据挖掘入门与实战 ?公众号: datadw Scikit-learn 是一个紧密结合Python科学计算库(Numpy、Scipy、matplotlib),集成经典机器学习算法的Python模块。 一、统计学习:scikit-learn中的设置与评估函数对象 (1)数据集 scikit-learn 从二维数组描[详细]
-
大数版的斐波那契数列
所属栏目:[大数据] 日期:2020-12-25 热度:55
光棍的yy http://acm.nyist.net/JudgeOnline/problem.php?pid=655 时间限制:1000?ms ?|? 内存限制:65535?KB 难度:2 输入 第一行输入一个n表示有n个测试数据 以下n行,每行输入m个1 (1 = n,m = 200) 输出 输出这种组合种数,占一行 样例输入 31111122222[详细]
-
A-B Problem 大数相等
所属栏目:[大数据] 日期:2020-12-25 热度:118
A-B Problem http://acm.nyist.net/JudgeOnline/problem.php?pid=524 时间限制:1000?ms ?|? 内存限制:65535?KB 难度:3 输入 有多组测试数据。每组数据包括两行,分别代表A和B。 它们的位数小于100,且每个数字前中可能包含+,- 号。 每个数字前面和后面[详细]
-
大数据时代必不可少的大数据分析和制作工具大全
所属栏目:[大数据] 日期:2020-12-25 热度:109
1.微信大数据分析工具 新媒体指数:http://www.gsdata.cn 2.数据可视化工具 百度ECharts:http://echarts.baidu.com/ Cytoscape:http://www.cytoscape.org/ 图表秀:http://www.tubiaoxiu.com/ 数据观:http://shujuguan.cn/ 微博足迹可视化:http://vis.[详细]
-
A+B Problem II 大数加法
所属栏目:[大数据] 日期:2020-12-25 热度:193
A+B Problem II http://acm.nyist.net/JudgeOnline/problem.php?pid=103 时间限制:3000?ms ?|? 内存限制:65535?KB 难度:3 输入 The first line of the input contains an integer T(1=T=20) which means the number of test cases. Then T lines follow[详细]
-
条条大道通罗马:大数据分析工具的十条学习路径
所属栏目:[大数据] 日期:2020-12-25 热度:192
来自:IT经理网(微信号:ctociocom) 链接:www.ctocio.com/hotnews/22900.html (点击尾部阅读原文前往) 虽然只有极少数人能够修炼成数据科学家这一21世纪最性感多金专业人士,但对于大多数非数据分析专业的IT人士来说,掌握对路的大数据工具同样意味着[详细]
-
NBA篮球运动员大数据分析决策支持系统
所属栏目:[大数据] 日期:2020-12-25 热度:80
package com.dt.spark.sparksql import org.apache.hadoop.conf.Configuration import org.apache.hadoop.fs.{FileSystem,Path} import org.apache.spark.SparkConf import org.apache.spark.sql.SparkSession /** ? * NBA篮球运动员大数据分析决策支持系[详细]
-
企业BI系统应用的切入点及五大策略
所属栏目:[大数据] 日期:2020-12-25 热度:84
从技术的角度来看,BI的技术正在走向成熟,处于一个发展的阶段,但它促使了BI的应用在成本方面开始逐步的降低,越来越多的企业在BI应用方面取得了成功。从实施的角度来出发,实施商业智能系统是一项复杂的系统工程,整个项目涉及企业管理,运作管理,信息[详细]
-
挖掘隐式启动Activity可能存在的坑
所属栏目:[大数据] 日期:2020-12-25 热度:140
今日科技快讯 很早之前,谷歌母公司Alphabet的董事长施密特就曾经表示,在中国市场,谷歌需要寻找到一个商业伙伴来开展自身的一些业务。而近日有消息传出,谷歌和网易正在进行合作磋商,很可能是成立合资公司,在国内推出针对中国市场的Google Play应用商[详细]
-
pyhive 连接 Hive 时错误
所属栏目:[大数据] 日期:2020-12-25 热度:159
一、User: xx is not allowed to impersonate xxx' 解决办法:修改 core-site.xml 文件,加入下面的内容后重启 hadoop。 property namehadoop.proxyuser.xx.hosts/name value*/value/propertyproperty namehadoop.proxyuser.xx.groups/name value*/value/p[详细]
-
分布式基础通信协议:paxos、totem 和 gossip(转载)
所属栏目:[大数据] 日期:2020-12-25 热度:82
背景: 在分布式中,最难解决的一个问题就是多个节点间数据同步问题。为了解决这样的问题,涌现出了各种奇思妙想。只有在解决了如何进行信息同步的基础之上才衍生出形形色色的应用。这里开始介绍几种分布式通信协议。 简单即有效——totem协议: totem协议[详细]
-
Hive 导入 parquet 格式数据
所属栏目:[大数据] 日期:2020-12-25 热度:54
Hive 导入 parquet 数据步骤如下: 查看 parquet 文件的格式 构造建表语句 倒入数据 一、查看 parquet 内容和结构 下载地址 社区工具 GitHub 地址 命令 查看结构: java -jar parquet-tools-1.6.0rc3-SNAPSHOT.jar schema -d activity.201711171437.0.parq[详细]
-
Presto 常用配置及操作
所属栏目:[大数据] 日期:2020-12-25 热度:142
一、介绍 Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。 推荐阅读 Presto实现原理和美团的使用实践 二、安装 2.[详细]
-
大数据的技术生态概述(转载)
所属栏目:[大数据] 日期:2020-12-25 热度:189
副标题#e# 如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系? 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗[详细]
-
九种常见的数据分析模型
所属栏目:[大数据] 日期:2020-12-25 热度:130
副标题#e# 1. 漏斗分析模型 漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。 运营人员可以通过观察不同属性的用户群体(如新注册用户与老客户、不同渠道来源的客户)各环节转化率,各流程[详细]
-
大数据领域常用技术栈
所属栏目:[大数据] 日期:2020-12-25 热度:186
副标题#e# 提起大数据,不得不提由IBM提出的关于大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),而对于大数据领域的从业人员的日常工作也与这5V密切相关。大数据技术在过去的几十年中取得[详细]
-
Databricks说的Lakehouse是什么?
所属栏目:[大数据] 日期:2020-12-25 热度:150
副标题#e# ? 在过去的几年里,Lakehouse作为一种新的数据管理范式,已独立出现在Databricks的许多用户和应用案例中。在这篇文章中,我们将阐述这种新范式以及它相对于之前方案的优势。 数据仓库在决策支持和商业智能应用方面有着悠久的历史。自20世纪80年代[详细]
-
成为技术高手:想更了解自己的偶像么?教你用技术手段挖掘他#92
所属栏目:[大数据] 日期:2020-12-25 热度:84
点击上方“云栖社区”可以订阅哦 摘要 是否在不同的电影中,总是能看到那些熟悉却叫不上名字的演员们,想知道他们之间相互的关系么?本文将带你一步一步地挖掘出他们的关系。想更了解自己的偶像么,那就试试吧。 以下为译文 我最近换了个工作,在入职之前[详细]
-
数据挖掘中的模式发现(六)挖掘序列模式
所属栏目:[大数据] 日期:2020-12-24 热度:115
序列模式挖掘 序列模式挖掘(sequence pattern mining)是数据挖掘的内容之一,指挖掘相对时间或其他模式出现频率高的模式,典型的应用还是限于离散型的序列。。 其涉及在数据示例之间找到统计上相关的模式,其中数据值以序列被递送。通常假设这些值是离散的[详细]
-
关于评论话题挖掘的研究及其实现代码(二)词图切分
所属栏目:[大数据] 日期:2020-12-24 热度:124
引言 在上一篇的博客谈到使用LDA的方法挖掘影迷关注点可谓是无功而返。后来我思考了许久,决定将原来的向量空间模型转变为词语网(WordNet),然后通过社区检测算法来把网络划分不同的社区,从而确定为不同的话题。 社区检测算法 现实世界中的许多系统都可[详细]
-
《MySQL必知必会》学习笔记五(数据处理函数)------掌握部分
所属栏目:[大数据] 日期:2020-12-24 热度:143
副标题#e# MySQL必知必会知识预览 第一章——了解SQL 第二章——MySQL简介 第三章——使用MySQL 第四章——检索数据 第五章——排序检索数据 第六章——过滤数据 第七章——数据过滤 第八章——用通配符进行过滤 第九章——用正则表达式进行搜索 第十章——[详细]
-
数据挖掘 : 手把手教你做文本挖掘
所属栏目:[大数据] 日期:2020-12-24 热度:89
副标题#e# 文本挖掘定义 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。 ? 2 文本挖掘步骤 1)读取数据库或本地外[详细]
-
微信红包先抢和后抢差距居然这么大!春节抢红包的大数据分析
所属栏目:[大数据] 日期:2020-12-24 热度:189
副标题#e# 春节是中华民族隆重的农历新年 这是世界上规模最大的节日 在春节前后 炎黄子孙们不远万里衣锦还乡 与亲人们团圆 在此期间 中国的铁路上会发生 地球上最大规模的人口迁徙 作为世界上最能吃最能玩的种族 聪明勇敢的中国人发明了非常多的娱乐活动 比[详细]
-
NMEA library数据处理过程分析
所属栏目:[大数据] 日期:2020-12-24 热度:103
? ?今天学习一个GPS数据解析开源库——NMEA lib。使用这个库,可以轻松处理GPS接收机发出的数据,并不需要了解NMEA的具体协议,这个库可以解析所有NMEA0813规定的所有报文格式。不仅可以解析出原始数据中包含的所有参数,还可以计算两点之间的距离、方向以[详细]

浙公网安备 33038102330481号