任务描述
本关任务:分析同一种搜索词,哪个网站域名被用户访问最多,并根据访问次数降序取前十。
编程要求
在右侧编辑器补充代码,分析同一种搜索词,哪个网站域名被用户访问最多,并根据访问次数降序取前十。
创建数据库:mydb
创建原始表:db_search
字段名 | 类型 | 注释 |
---|---|---|
id | string | 用户编号 |
key | string | 搜索关键词 |
ranking | int | 该URL 在返回结果中的排名 |
or_der | int | 点击顺序 |
url | string | 域名 |
time | string | 时间 |
部分数据如下:
数据切分方式:空格
数据所在位置:/root/data.txt
测试说明
平台会对你编写的代码进行测试:
预期输出:
[陋俗] www.qihoo.com 5529
[周恩来] bbs.phoenixtv.com 2050
[女艺人] bbs.union.daqi.com 1662
[北京的GAY吧] love.86gay.com 1217
[张玉凤] bbs.union.daqi.com 1171
[百度] www.baidu.com 1076
[林彪] bbs.phoenixtv.com 885
[明星] club.yule.sohu.com 864
[《十景缎》] book.haahoo.com 638
[富婆] bbs.enet.com.cn 591
开始你的任务吧,祝你成功!
代码如下:
---------- 禁止修改 ----------drop database if exists mydb cascade;---------- 禁止修改 -------------------- begin -------------创建mydb数据库create database if not exists mydb;---使用mydb数据库use mydb;---创建表db_searchcreate table if not exists db_search(id string comment '用户id',key string comment '搜索关键词',ranking int comment 'url在返回结果中的排名',or_der int comment '点击顺序',url string comment '网站域名',time string comment '日期')row format delimited fields terminated by ' 'lines terminated by '/n'stored as textfile;---导入数据:/root/data.txtload data local inpath '/root/data.txt' into table db_search;--分析同一种搜索词,哪个网站域名被用户访问最多,并根据访问次数降序取前十。select t.key,t.url,t.cnt from(select key,url,count(*) cnt,row_number() over (partition by key order by count(*) desc) rk from db_search group by key,url) twhere t.rk<=1 order by t.cnt desc limit 10;---------- end ----------