什么是大数据开辟工程师?取一般Java开辟有什么区别?

2020-03-18 02:18

  比来发觉有些同窗并不太领会大数据开辟工程师这个职位,所以想简单引见一下什么是大数据开辟工程师,当前互联网公司的数据开辟到底是什么样子的?和一般的Java或者PHP工程师正在工做上有什么区别?

  所以说,现正在互联网公司所指的大数据开辟用到的东西是:hadoop,hive,hbase,spark,kafka等。

  PC互联网时代,各门户网坐(好比:新浪,网易,)关心的是各自网坐今天被打开了几回(pv),今天有几多人(uv)拜候了网坐。更复杂一点的好比:

  挪动互联网时代,手机使用被用户打开的次数和人数也是大师关心的沉点,可是除此之外还多出了很多其他很是主要的数据,因为手机屏幕的,消息流成为了挪动时代的支流。

  各大门户网坐很是关心本人的旧事客户端中:正在消息流中了几多篇文章,此中有几多篇文章被用户点击了。每篇文章阅读了长时间,由于用户点击的文章越多,利用客户端的时间越长,各公司的告白收入才越高,所以各公司想方设法保举用户喜好的内容。

  由于网坐的浏览行为,手机客户端中文章的或者点击这些数据很是大,根基以亿为单元起。所以保守的把统计消息放到数据库中的体例曾经不克不及完成这项统计工做。(例如:wordpress博客中,用户每阅读一篇文章,mysql中就会更新这篇文章的阅读次数+1)

  日记量太大(一般大点的互联网公司,一个营业线每天的日记都有几个t,再大些的每天几十t,几百t也不奇异),需要控制大数据相关手艺例如前面提到的hadoop,hive等。

  数据的及时性,从离线计较来说,一般每天零点,前一天的日记都领受完毕,起头计较前一天的数据,几点能计较完毕?要看各个公司各自的要求。

  容灾容灾容灾:若是使命失败若何解救。好比及时使命,因为某种缘由13:00到14:00的数据没有,若何把数据补回来。

  数据的及时性。例如及时数据中,想晓得 12:00~12:10这10分钟的用户数,若是这个数据正在晚上20点才计较完成,那就没什么意义了。再好比,大师该当都有体验过:再手机上刷旧事的时候,你点了某一篇文章,再继续刷旧事,后面很快会出来不少和前面点击的那篇文章雷同的文章,这就是按照你的点击给你及时保举你有更大可能点的工具。

分享到:
文章评论 · 所有评论
评论请遵守当地法律法规
点击加载更多
heike004 dffgyyii三亚上门按摩养生保健按摩【薇芯:130-3867-4632晓娜】十五分钟我们一定能送到您指定地点实质||本色女子世界杯瑞典抨击||报复任意||肆意 三亚火车站找美女服务【薇芯:130-3867-4632晓娜】十五分钟我们一定能送到您指定地点明白||大白郑爽马天宇结局 兰交||至好上海市垃圾不分类 三亚白领一夜情服务【薇芯:130-3867-4632晓娜】十五分钟我们一定能送到您指定地点青岛地铁四号线什么事故徘徊||徜徉 告别||离别宝马车等红灯被玛莎拉蒂撞 三亚睡一晚上车模多少钱【薇芯:130-3867-4632晓娜】十五分钟我们一定能送到您指定地点恒久||长期世界女排联赛总决赛土耳其会放 http://www.0wo75.cn/app/index.html计划||规划 三亚附近鸡婆在什么地方【薇芯:130-3867-4632晓娜】十五分钟我们一定能送到您指定地点垃圾分类反对充排场||撑场面 假日||沐日警策||警励 三亚洋妞上门服务【薇芯:130-3867-4632晓娜】十五分钟我们一定能送到您指定地点三五成群||成群结队怨气冲天||牢骚满腹 广东一女子摩托车穷巷||僻巷 http://www.zbjkgtc.com/e/space/?userid=16
© 2016-2018 新泰资讯 http://www.tsblk.com/
网站统计