牛客SQL刷题第三趴——SQL大厂面试真题

01 某音短视频

SQL156 各个视频的平均完播率

【描述】用户-视频互动表tb_user_video_log。(uid-用户ID, video_id-视频ID, start_time-开始观看时间, end_time-结束观看时间, if_follow-是否关注, if_like-是否点赞, if_retweet-是否转发, comment_id-评论ID)

短视频信息表tb_video_info。(video_id-视频ID, author-创作者ID, tag-类别标签, duration-视频时长(秒), release_time-发布时间)

【问题】计算2021年里有播放记录的每个视频的完播率(结果保留三位小数),并按完播率降序排序

注:视频完播率是指完成播放次数占总播放次数的比例。简单起见,结束观看时间与开始播放时间的差>=视频时长时,视为完成播放。
select t.video_id,
ROUND(sum(if((t.end_time-t.start_time)>=t1.duration,1,0))/count(start_time),3) as avg_comp_play_rate
from tb_user_video_log t 
left join tb_video_info t1
on t.video_id=t1.video_id
where year(t.start_time)='2021'
group by t.video_id
order by avg_comp_play_rate desc;

 解题思路:①、考察多表结合。

②、视频完播率的计算方法。

第1步:先计算完成播放次数。sum(if((t.end_time-t.start_time)>=t1.duration,1,0

第2步:计算总播放次数。count(start_time)

第3步:保存三位小数。使用ROUND(xx,3)

③、where子条件,筛选2021年,使用year函数

④、order by排序,按照完播率降序,使用desc。

 

SQL157 平均播放进度大于60%的视频类别

【描述】同上题

问题:计算各类视频的平均播放进度,将进度大于60%的类别输出。

注:播放进度=播放时长÷视频时长*100%,当播放时长大于视频时长时,播放进度均记为100%。

结果保留两位小数,并按播放进度倒序排序。

select t1.tag,
concat(ROUND(avg(if(timestampdiff(second,t.start_time,t.end_time)>=t1.duration,1,
             timestampdiff(second,t.start_time,t.end_time)/t1.duration))*100,2),'%') as avg_play_progress
from tb_video_info t1
join tb_user_video_log t
on t1.video_id=t.video_id
group by t1.tag
having avg_play_progress>60
order by avg_play_progress desc;

解题思路:

1、播放进度结算

①、时间差函数,timestampdiff(unit,char(begin-end))

②、判断,if或者用case when

③、结果保留两位小数,使用round(xx,2)

④、使用concat拼接数值和“%”

2、多表的内连接。

3、进度大于60%的类别输出,因为这个数值是聚合函数,需要使用having函数

4、并按播放进度倒序排序。使用order by desc

SQL158 每类视频近一个月的转发量/率

【描述】用户-视频互动表tb_user_video_log。(uid-用户ID, video_id-视频ID, start_time-开始观看时间, end_time-结束观看时间, if_follow-是否关注, if_like-是否点赞, if_retweet-是否转发, comment_id-评论ID)

短视频信息表tb_video_info。(video_id-视频ID, author-创作者ID, tag-类别标签, duration-视频时长, release_time-发布时间)

问题:统计在有用户互动的最近一个月(按包含当天在内的近30天算,比如10月31日的近30天为10.2~10.31之间的数据)中,每类视频的转发量和转发率(保留3位小数)。
注:转发率=转发量÷播放量。结果按转发率降序排序。
select t1.tag,
sum(t.if_retweet) as retweet_cut,-- 转发量
round(sum(t.if_retweet)/count(t.video_id),3) as retweet_rate
from tb_video_info t1
left join tb_user_video_log t
on t.video_id=t1.video_id
where date(start_time)>(select date_sub(MAX(start_time),interval 30 day) from tb_user_video_log)
group by t1.tag
order by retweet_rate desc;

解题思路:

转发量:sum(if_reweet)

转发率:转发量/播放量。也就是sum(if_reweet)/count(video_id)。结果保留3位小数,就是用ROUND(转发率,3)即可

最近30天:

写法①、date_sub函数(时间向前推移函数)

(select date_sub(MAX(start_time),interval 30 day) from tb_user_video_log   ------这一步的意思是以最新的播放日期为准,向前推移30天。

写法②、timestampdiff函数(时间差函数)

timestampdiff(date,t.start_time,(select max(t.start_time) from tb_user_video_log)<30

 

 

posted @ 2022-07-14 19:34  徐若离  阅读(196)  评论(0编辑  收藏  举报