当前位置:   article > 正文

山东大学软件学院2020-2021数据科学导论期末考试题_数据科学导论简答题

数据科学导论简答题

一、简答题

  1. 结合疫情分析说明大数据的全生命周期
  2. 举例说明关系型数据库的不足

二、设计题

  1. 设计mapreduce实现自然连接
  2. 新浪用redis存储用户信息,简述这样做的好处;○2新浪使用有序集合存储粉丝集合(数据规模可达亿),建立索引机制通过用户ID快速判断其是否在粉丝集合里

三、计算题

  1. TF-IDF的计算
  2. 加权的用户商品二分图,用随机算法推荐下一首音乐
音乐1音乐2音乐3音乐4音乐5音乐6音乐7
Alice541
Bob55442
John
xx

具体数据忘记了,大差不大。

建议选课时多听听学长学姐们的意见,莫使前人哀后人

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/233139?site
推荐阅读
相关标签
  

闽ICP备14008679号