About 23 results
Open links in new tab
  1. HBase 和 Hive 的差别是什么,各自适用在什么场景中? - 知乎

    1. Hive中的表是纯逻辑表,就只是表的定义等,即表的元数据。 Hive本身不存储数据,它完全依赖HDFS和MapReduce。 这样就可以将结构化的数据文件映射为为一张数据库表,并提供完整 …

  2. 如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark

    自从数据分析人员开始用Hive分析数据之后,它们发现,Hive在MapReduce上跑,真鸡巴慢! 流水线作业集也许没啥关系,比如24小时更新的推荐,反正24小时内跑完就算了。 但是数据分 …

  3. 如何通俗地理解Hive的工作原理? - 知乎

    接下去Hive会对执行计划进行优化,最常见的优化可能是PartitionPrune,比如你在Hive中定义了分区表,那么如果有Where条件中出现了分区字段,比如WHERE date = '2016-08-25',而且分 …

  4. 数仓篇:Hive优化实践(二)治理小文件

    Hive小文件产生的背景 数据写入频率较高:Hive表被映射到HDFS文件,频繁写入可能以小文件形式存在; 映射表的切分限制:Hive表映射为HDFS文件时,按照数据块大小进行切割,表中存 …

  5. 请问spark和hive是什么关系? - 知乎

    再来看看hive。 hive 官网有描述,“Apache Hive data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL.”,hive的定位 …

  6. IT 圈里有哪些经常被读错的词? - 知乎

    IT 圈里有哪些经常被读错的词?

  7. 基于hive的数据仓库如何处理数据更新(update)问题? - 知乎

    Mar 15, 2018 · 3) Hive的执行延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场合。 4) Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高。 5) Hive …

  8. 求大神帮助:hive获取周一的日期? - 知乎

    hive本身提供的时间函数已经很丰富了,基本上能满足我们所有的需求,一些特殊需求也可以通过增加一些数学逻辑实现出来。 接下来看一下类别的日期和时间函数的使用方式。 1.时间戳和 …

  9. pyspark 如何读取大数据平台中的 hive 数据表? - 知乎

    比如我们指定使用MySQL作为Hive元数据的存储介质,那么就需要把Hive连接MySQL的相关属性配置在hive-site.xml文件中,这样不管是本地模式还是远程模式启动,不管客户端本地连接还 …

  10. hi~大家好,想问一下hive sql有没有线上练习编程的地方? - 知乎

    hi~大家好,想问一下hive sql有没有线上练习编程的地方? 关注者 12 被浏览

  11. Some results have been removed
Refresh