qps, 如果是5万日活,使用集中在每天的4小时,每个用户大概产生100的请求,那么平均下来,我们系统大概应该支撑的请求为:50000 100 / (4 60 * 60) = 350 qps/s
业务数据 业务量,我们自己是新闻业务,可能会有其他的业务,比如游戏,商城等等,基本每天新增的业务数据都会在同一个量级, 每日10000, 另外跟用户相关的信息也是比较大的一块,比如用户的订阅等行为,一共5万的用户,保存相关信息可能大概需要100条的数据。
缓存大小 主要业务数据和用户相关的热点数据限时保存在缓存中, 大概需要5个g左右。
日志大小 用户日志和请求日志。 大概每天3个g左右

整体架构因为是小公司,我们基于阿里云来搭建,对图中的内容和技术选型进行一下说明:
目前可选的有zk + dubbo. zk + motan, zk + dubbox, edas。
dubbo, 阿里的服务治理框架,已经不维护了,切换反应有点慢
dubbox, 当当基于dubbo搞的,还在维护可以一用,推荐。
motan, 微博的服务治理矿建, 刚开源,需要学习一下, 推荐。
edas, 阿里云服务,要收钱,侵入型很强,不推荐
可选的有: activemq, 阿里云消息, robbitmq,
各有好处, 但是考虑到运维的难度,推荐阿里云消息。
把业务底层做成soa模块,通过分布式调用框架对外提供服务。
单独做一个小的系统来运行定时任务
热点数据放缓存,然后通过mq来更新缓存
日志等数据有必要可以考虑上个mongo