B站我想大家都熟悉吧,其实 B 站的爬虫网上一搜一大堆。不过纸上得来终觉浅,绝知此事要躬行,我码故我在。最终爬取到数据总量为 760万 条。
准备工作
首先打...
技术干货
专注于生产最新鲜的开源资讯、Linux业界新闻和热门奇趣帖子,您还可关注本站的微信、微博等自媒体频道。
Linux技术交流群:点此查看 微信公众号:linuxprobe 也可直接搜索:linux就该这么学。
投稿指南:https://www.linuxprobe.com/tougao/
刘遄老师亲自上课的培训课程:https://www.linuxprobe.com/training
导读
Linux 新手往往对命令行心存畏惧。部分原因是因为需要记忆大量的命令,毕竟掌握命令是高效使用命令行的前提不幸的是,学习这些命令并无捷径,然而在...
分析框架
1、以算法输入规模n作为参数进行分析算法效率
2、时间复杂度:找出基本操作O(1),再计算它的运行次数(忽略乘法常量,仅关注增长次数)
3、增长次数...
蛮力法是一种简单直接地解决问题的方法,常常直接基于问题的描述和所涉及的概念定义。
选择排序思想:
在选择排序开始的时候,扫描整个列表,找到最小元素,...
冒泡排序是蛮力法的另一个经典体现。
算法思想:比较列表中相邻的元素,如果是逆序的话,就交换他们的位置。重复多次之后,最大的元素就排到了最后一个位置。...
一:说明进程在三个基本状态之间转换的典型原因
(1)处于就绪状态的进程,当进程调度程序为其分配了处理机后,该进程就由就绪状态转变为执行状态。
(2)正在执...
两个正整数相乘的非主流算法
假设n和m是两个正整数,计算n*m,现在用n的输入作为实例规模的度量标准。
假设n是偶数,一个规模为原来一半的实例必须要对n/2进...
一个不幸的事实是,所有的软件都有 bug,一些 bug 会导致系统崩溃。当它出现的时候,它经常会在磁盘上留下一个被称为“核心转储”的数据文件。该文件包含有关系...
二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好,占用系统内存较少;
其缺点是要求待查表为有序表,且插入删除困难。
因此,折半查找方法...
$()和${}的用法:
在 bash shell 中,$( ) 与 ` ` (反引号) 都是用来做命令替换用(command substitution)的。而 $( ) 并不见的每一种 shell 都能使用,若你用...
Netstat 简介
Netstat 是一款命令行工具,可用于列出系统上所有的网络套接字连接情况,包括 tcp, udp 以及 unix 套接字,另外它还能列出处于监听状态(即等待...
导读
大多数人学习的第一门编程语言是C/C++,个人觉得C/C++也许是小白入门的最合适的语言,但是必须承认C/C++确实有的地方难以理解,初学者如果没有正确理...
前言
MySQL是项目中常用的数据库,其中in查询也是很常用。最近项目调试过程中,遇到一个出乎意料的select查询,竟然用了33秒!
一、表结构
1. userinfo 表
2...
这两天看微博上有人讨论swappiness相关问题,mysqlperformanceblog上也有人说将swappiness设成0后MySQL被“意外” kill掉,另外自己所在团队线上也遇到过类似问...
导读
自从进入网络时代,大家的生活也愈加多姿多彩起来,但也多出了很多烦恼。例如,信息海洋中时不时出现的大群垃圾,以及深渊,就令人防不胜防。
自...
导读
分层架构是逻辑上的,在物理部署上,三层架构可以部署在同一个物理机器上,但是随着网站业务的发展,必然需要对已经分层的模块分离部署,即三层结构...
导读
对传统IDC服务而言,未来定制化的需求将会得到市场的更多青睐和认可,传统IDC而言在云计算时代而言,需要积极的自我求变和转型。不然,也许淘汰并不...
你或许不会知道,咱们其实可以用windows注册表来检测是否曾经有一个特殊的USB设备连接过你的电脑。
验证USB设备的插入的重要性
大家可能不会相信,也许有...
什么是日志?
日志就是按照时间顺序追加的、完全有序的记录序列,其实就是一种特殊的文件格式,文件是一个字节数组,而这里日志是一个记录数据,只是相对于文...