GeekBand C++系统设计与实践 第一周

1.系统设计介绍

2.系统设计七剑客

  • 同步
  • 网络
  • 数据库
  • 分布式
  • 性能
  • 估算
  • 面向对象
  • 案例
    • 社交网站信息流
    • 日志统计
    • 网络爬虫
    • 电商产品页面

1)Concurrency (并发)

  • Thread vs. Process
    • 一个进程拥有独立的内存单位,而线程是共享内存的
    • 一个进程拥有一个主线程
    • 进程是系统进行独立资源调度分配的单位
    • 线程是真正的CPU分片时间
  • Consumer and Producer
    • 两个线程,两个线程共同访问一个缓冲区
    • 一个线程是生产者,将数据放入缓冲区,另一个线程是消费者,消费缓冲区中的数据
    • 如何保证生产者不会再缓冲区满的时候放入数据,消费者不会再缓冲区空的时候访问缓冲区
    • Blocking Queue是一种典型的这种容器。
  • Tracking:
    • Synchronized 同步方式
    • Asynchronized 异步方式

2)Network 网络模型

  • The Seven Layers of OSI

    • Application Layer HTTP协议
    • Presentation Layer
    • Session Layer
    • Transport Layer TCP/UDP
    • Network Layer
    • Data Link Layer
    • Physical Layer
  • Visit URL

    • What happens after you typed a URL in your browser and pressed return key?
    • 需要连接远端服务器
      • 需要服务器的IP和端口
      • 如果没有IP和端口,则需要进行寻址,访问DNS(domain naming service)服务器,通过分层可以找到相应DNS
      • DNS返回服务器的IP
      • 和远端服务器进行TCP连接,没有指定端口时,默认80端口
      • 和服务器建立HTTP会话
      • 远端服务器返回数据,浏览器解析数据,本渲染出网页。
    • 发送请求到服务器

3)Database 数据库

  • Relational DB vs. KV Store
    • KV在需求简单,数据量又较大,没有太多关联关系时使用。
  • Sharding vs. Clustering
    • 一般认为单表数据量控制在1000w以内,如果超过这个量,则需要进行拆表
    • 通过协调器,来均衡各个服务器的负载。内部智能动态调度。

4)Distribute System 分布式

How to scale Tiny URL service?

  • Stateless frontend servers behind a load balancr 前段服务做负载均衡,Stateless 没有状态,当用户操作时,当工作做了一般,转换服务器之后,还可以继续,而不是仍然要使用原有的服务器。
  • Sharded/replicated database(on shortlink code)
  • Memcached to scale read traffic 通过缓存,缓解数据库读取压力
  • Spread write load 可以通过先定位,再写入的方式
  • Locally buffered event tracking + async flush to high-throughput message queue(kafka)
  • Use a distributed unique ID generator(64-bit)

5) Performance 性能

CPU -> L1 -> L2 -> L3 -> SSD -> HD -> Network 速度越来越慢

6) Estimation 估算

How many piano tuners are there in the entire world?

  • 考察思维逻辑推理
  • 对估算是否有考虑

Tiny URL:How much is total storage?

  • URL 的平均长度 10-1000 字节
  • 假设目前已经存了一亿个
  • 新增的URL大概是一天100000条(1秒增加一条)
  • 一天大概需要查询一亿次,每秒1000次

7)Design Patten 设计模式

23 patterns:

  • MVC
  • Singleton
  • Factory
  • Iterator
  • Decorator
  • Facade

3.案例

News Feeds

  • Define feed
    • 首先要定义feed的内容,可以是一个新闻的片段,应该包含内容,发布人,发布时间
  • Organize
    • aggregate 同一个人发布多条信息,是否需要归类
    • dedup 如果同一条信息多人发布,能否去重
    • sort 更具发布时间,或内容的重要新(亲密度,高级用户)
    • Level 1.0
      • Database Schema:
        • User
        • Friendship
        • News
      • Get Newsfeed
        • merge news
      • Newsfeed vs. News
        • Newsfeed是一个集合,我的主页需要显示的,我的好友圈
        • News仅仅是一个新闻。
      • Why bad?
      • 100+ friends
        • 1 Query --> Get friends list
        • 1 Query --> SELECT news WHERE timestamp>xxx AND sourceid IN friend list LIMIT 1000
      • IN 非常慢
      • Sequential scan or 100+ index queries
    • Level 2.0
    • Pull vs. Push
      • Pull:Get news from each frined,merge them together.
      • Push: NewsFeed generated when news generated.
    • Level 3.0
      • Popular star
        • Flowers 13M + 人数太多
        • Async Push may cause over 30 minutes
      • Push + Pull
        • 对于明星人群,不要push news 给 flowers
        • 对于普通人,两者结合
    • Level 4.0
      • Push disadbantage:
        • Realtime
        • Storage(Duplicate)
        • Edit
      • Go back to PULL:
        • Cache user's latest news
        • Broadcast multiple request to multiple servers(Shard by userID)
        • Merge & Sort
        • Cache newsfeeds for this user with timestamp

Stats Server

How are click stats stored?

  • 每次点击就会将写入数据库
  • 增加中间层,再根据某种策略,将中间层写入数据库
  • 设计出一个 low-latency messaging,能够缓存数据,还能够存入数据库

Cache Requirement

  • 当收到request,首先在cache中寻找,如果找到则直接返回
  • 如果没有找到则传入系统
  • 设计cache只能存储一定量的request,如果超过,则删除最早的request。
  • 查找,删除,插入 O(1)

Web Crawler

Amazon Product Page

  • The product page includes information such as
    • a) product information
    • b) user information
    • c) recommended products
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,839评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,543评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,116评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,371评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,384评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,111评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,416评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,053评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,558评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,007评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,117评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,756评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,324评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,315评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,539评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,578评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,877评论 2 345

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,600评论 18 139
  • 从三月份找实习到现在,面了一些公司,挂了不少,但最终还是拿到小米、百度、阿里、京东、新浪、CVTE、乐视家的研发岗...
    时芥蓝阅读 42,192评论 11 349
  • API定义规范 本规范设计基于如下使用场景: 请求频率不是非常高:如果产品的使用周期内请求频率非常高,建议使用双通...
    有涯逐无涯阅读 2,519评论 0 6
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,587评论 18 399
  • 今天一整天都在被父亲节刷屏,不知道父亲们是否真的快乐?我相信每一个人都有孝心,可太多人的孝心停留在嘴皮上。 我一直...
    温筱冰阅读 338评论 0 0