短链接生成系统源码(短链接生成算法)

今天给各位分享短链接生成系统源码的知识,其中也会对短链接生成算法进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

短链接源码是什么意思

是将长的URL网址,通过程序计算等方式,转换为简短的网址字符串。短链接一经生成不会变化。链接是指电子计算机程序的各个模块之间传递参数和控制命令。

为什么有的URL长,有的短?

一、前言

前几天整理面试题的时候,有一道试题是《如何将一个很长的URL转换为一个短的URL,并实现他们之间的相互转换?》,现在想起来这是一个绝对不简单的问题,需要考虑很多方面,今天和大家一起学习研究一下!

短网址:顾名思义,就是将长网址缩短到一个很短的网址,用户访问这个短网址可以重定向到原本的长网址(也就是还原的过程)。这样可以达到易于记忆、转换的目的,常用于有字数限制的微博、二维码等等场景。

关于短URL的使用场景,举个简单的例子来说明一下,看一下业务中使用短URL的重要性!

二、短地址使用场景

1、新浪微博

我们在新浪微博上发布网址的时候,微博会自动判别网址,并将其转换,例如:。为什么要这样做的?

这是因为微博限制字数为140字一条,那么如果我们需要发一些链接上去,但是这个链接非常的长,以至于将近要占用我们内容的一半篇幅,这肯定是不能被允许的或者说用户体验很差的,所以短网址应运而生了,短网址这种服务可以说是在微博出现之后才流行开来的!往下看:

(1)首先,我先发一条微博带有一个URL地址:

(2)然后,看他转换之后显示的效果是什么样子的哪?

(3)查看对应页面元素的HTML源码如下:

(4)可以看出: 被转换为:,此时你访问是可以定位到,也就是实现了转换。

2、短网址二维码

网址在转换成短网址时,也可以生成相应的短网址二维码,短网址二维码的应用,二维码核心解决的是跨平台、跨现实的数据传输问题;而且二维码跟应用场景结合之后,所能解决的问题会越来越多。

(1)短网址二维码相比短链接更方便,能少输入,尽量少输入,哪怕只是少点一下键盘,都是有意义的。

(2)二维码只是扫描一个简单的链接,打开的却是一个世界。想象一下,用手机购买售货机里商品,二维码扫描是略快于从用手机找到该售货机并找到该商品的,而且这种操作相对于搜索/查找而言不是更优雅吗?

(3)所有商超里面的商品,都是使用条码来确定商品的唯一性的,去买单的时候都是扫描条码。试想,如果里面加入了更多产品的生产日期、厂家、流转途径、原材料等等信息,是不是厉害了呢?特别是针对食品信息的可追溯上,二维码应用场景更广泛。

三、短地址的好处

除了上述场景中,我们将长地址转换为短地址的使用场景的优点(压缩URL长度)之外,短地址还具有很多实际场景中的优点,例如:

(1)节省网址长度,便于社交化传播,一个是让URL更短小,传播更方便,尤其是URL中有中文和特殊字符,短网址解决很长的URL难以记忆不利于传播的问题;

(2)短网址在我们项目里可以很好的对开放以及对URL进行管理。有一部分网址可以会涵盖性、暴力、广告等信息,这样我们可以通过用户的举报,完全管理这个连接将不出现在我们的应用中,对同样的URL通过加密算法之后,得到的地址是一样的;

(3)方便后台跟踪点击量、地域分布等用户统计。我们可以对一系列的网址进行流量,点击等统计,挖掘出大多数用户的关注点,这样有利于我们对项目的后续工作更好的作出决策;

(4)规避关键词、域名屏蔽手段、隐藏真实地址,适合做付费推广链接;

(5)当你看到一个淘宝的宝贝连接后面是200个“e7x8bv7c8bisdj”这样的字符的时候,你还会觉得舒服吗。更何况微博字数只有140字,微博或短信里,字数不够,你用条短网址就能帮你腾出很多空间来;

四、短网址服务提供平台

目前,国内网又很多提供短地址服务的平台,例如:

新浪:

百度:

0x3:

MRW:

等等还有很多,这个可以搜索一下就会有很多!但是一个注意的是,如果使用某一个平台的短地址服务,一定要保证长期可靠的服务,不然一段时间失效了,我们以前已经转换的URL就完了!

这里以百度例,将我们上述博客的地址转换为短地址如下所示:

当然,对于我们的业务来说,如果自己可以提供自己的短URL服务那才是更好的,不需要受制于人!(中国芯片需要崛起!!!)

五、关于如何生成短地址URL的讨论

关于短地址URL如何生成方式的,网上有很多方式,有基于映射的,有基于Hash的,有基于签名的,但是总的来说并不能满足绝大部分场景的使用,或者说是一种错误的设计方式。这里不再重复造轮子!以下是知乎用户iammutex关于该问题的探讨,截图过来和大家一起学习一下:

作者:iammutex

链接:

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

六、生成短地址URL需要注意的

看到上述知乎用户iammutex关于如何正确生成短地址URL的探讨,我们知道了,可以通过发号器的方式正确的生成短地址,生成算法设计要点如下:

(1)利用放号器,初始值为0,对于每一个短链接生成请求,都递增放号器的值,再将此值转换为62进制(a-zA-Z0-9),比如第一次请求时放号器的值为0,对应62进制为a,第二次请求时放号器的值为1,对应62进制为b,第10001次请求时放号器的值为10000,对应62进制为sBc。

(2)将短链接服务器域名与放号器的62进制值进行字符串连接,即为短链接的URL,比如:。

(3)重定向过程:生成短链接之后,需要存储短链接到长链接的映射关系,即sBc - URL,浏览器访问短链接服务器时,根据URL Path取到原始的链接,然后进行302重定向。映射关系可使用K-V存储,比如Redis或Memcache。

七、生成短地址之后如何跳转哪?

对于该部分的讨论,我们可以认为他是整个交互的流程,具体的流程细节如下:

(1)用户访问短链接:;

(2)短链接服务器收到请求,根据URL路径RuPKzRW获取到原始的长链接(KV缓存数据库中去查找):;

(3)服务器返回302状态码,将响应头中的Location设置为:;

(4)浏览器重新向发送请求;

(5)返回响应;

八、短地址发号器优化方案

1、算法优化

采用以上算法,如果不加判断,那么即使对于同一个原始URL,每次生成的短链接也是不同的,这样就会浪费存储空间(因为需要存储多个短链接到同一个URL的映射),如果能将相同的URL映射成同一个短链接,这样就可以节省存储空间了。主要的思路有如下两个:

方案1:查表

每次生成短链接时,先在映射表中查找是否已有原始URL的映射关系,如果有,则直接返回结果。很明显,这种方式效率很低。

方案2:使用LRU本地缓存,空间换时间

使用固定大小的LRU缓存,存储最近N次的映射结果,这样,如果某一个链接生成的非常频繁,则可以在LRU缓存中找到结果直接返回,这是存储空间和性能方面的折中。

2、可伸缩和高可用

如果将短链接生成服务单机部署,缺点一是性能不足,不足以承受海量的并发访问,二是成为系统单点,如果这台机器宕机则整套服务不可 用,为了解决这个问题,可以将系统集群化,进行“分片”。

在以上描述的系统架构中,如果发号器用Redis实现,则Redis是系统的瓶颈与单点,因此,利用数据库分片的设计思想,可部署多个发号器实例,每个实例负责特定号段的发号,比如部署10台Redis,每台分别负责号段尾号为0-9的发号,注意此时发号器的步长则应该设置为10(实例个数)。

另外,也可将长链接与短链接映射关系的存储进行分片,由于没有一个中心化的存储位置,因此需要开发额外的服务,用于查找短链接对应的原始链接的存储节点,这样才能去正确的节点上找到映射关系。

九、如何用代码实现短地址

1、使用随机序列生成短地址

说到这里终于说到重点了,很多小伙伴已经按捺不住了,不好意思让大家失望了,这只是一片简单的文章,并不能把这么繁杂的一个系统演示清楚!秉着不要重复造轮子的原则,这里给出一个为数不多还算可以的实现短地址的开源项目:urlshorter

注意:urlshorter本身还是基于随机的方式生成短地址的,并不算是一个短地址发号器,因此会有性能问题和冲突的出现,和知乎用户iammutex 描述的实现方式还是有区别的!而关于短地址发号器的方式目前还没有找到更好的开源项目可供参考!

项目地址:

2、使用SnowFlake发号器生成短地址

实现参考:

Twitter的雪花算法SnowFlake,使用Java语言实现。

SnowFlake算法用来生成64位的ID,刚好可以用long整型存储,能够用于分布式系统中生产唯一的ID, 并且生成的ID有大致的顺序。 在这次实现中,生成的64位ID可以分成5个部分:

0 - 41位时间戳 - 5位数据中心标识 - 5位机器标识 - 12位序列号

5位数据中心标识、5位机器标识这样的分配仅仅是当前实现中分配的,如果业务有其实的需要,可以按其它的分配比例分配,如10位机器标识,不需要数据中心标识。

Java代码实现如下:

/**

* 进制转换工具,最大支持十进制和62进制的转换

* 1、将十进制的数字转换为指定进制的字符串;

* 2、将其它进制的数字(字符串形式)转换为十进制的数字

* @author xuliugen

* @date 2018/04/23

*/

public class NumericConvertUtils {

/**

* 在进制表示中的字符集合,0-Z分别用于表示最大为62进制的符号表示

*/

private static final char[] digits = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9',

'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm',

'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z',

'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M',

'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z'};

/**

* 将十进制的数字转换为指定进制的字符串

* @param number 十进制的数字

* @param seed 指定的进制

* @return 指定进制的字符串

*/

public static String toOtherNumberSystem(long number, int seed) {

if (number 0) {

number = ((long) 2 * 0x7fffffff) + number + 2;

}

char[] buf = new char[32];

int charPos = 32;

while ((number / seed) 0) {

buf[--charPos] = digits[(int) (number % seed)];

number /= seed;

}

buf[--charPos] = digits[(int) (number % seed)];

return new String(buf, charPos, (32 - charPos));

}

/**

* 将其它进制的数字(字符串形式)转换为十进制的数字

* @param number 其它进制的数字(字符串形式)

* @param seed 指定的进制,也就是参数str的原始进制

* @return 十进制的数字

*/

public static long toDecimalNumber(String number, int seed) {

char[] charBuf = number.toCharArray();

if (seed == 10) {

return Long.parseLong(number);

}

long result = 0, base = 1;

for (int i = charBuf.length - 1; i = 0; i--) {

int index = 0;

for (int j = 0, length = digits.length; j length; j++) {

//找到对应字符的下标,对应的下标才是具体的数值

if (digits[j] == charBuf[i]) {

index = j;

}

}

result += index * base;

base *= seed;

}

return result;

}

}

/**

* Twitter的SnowFlake算法,使用SnowFlake算法生成一个整数,然后转化为62进制变成一个短地址URL

* @author beyond

* @author xuliugen

* @date 2018/04/23

*/

public class SnowFlakeShortUrl {

/**

* 起始的时间戳

*/

private final static long START_TIMESTAMP = 1480166465631L;

/**

* 每一部分占用的位数

*/

private final static long SEQUENCE_BIT = 12; //序列号占用的位数

private final static long MACHINE_BIT = 5; //机器标识占用的位数

private final static long DATA_CENTER_BIT = 5; //数据中心占用的位数

/**

* 每一部分的最大值

*/

private final static long MAX_SEQUENCE = -1L ^ (-1L SEQUENCE_BIT);

private final static long MAX_MACHINE_NUM = -1L ^ (-1L MACHINE_BIT);

private final static long MAX_DATA_CENTER_NUM = -1L ^ (-1L DATA_CENTER_BIT);

/**

* 每一部分向左的位移

*/

private final static long MACHINE_LEFT = SEQUENCE_BIT;

private final static long DATA_CENTER_LEFT = SEQUENCE_BIT + MACHINE_BIT;

private final static long TIMESTAMP_LEFT = DATA_CENTER_LEFT + DATA_CENTER_BIT;

private long dataCenterId; //数据中心

private long machineId; //机器标识

private long sequence = 0L; //序列号

private long lastTimeStamp = -1L; //上一次时间戳

/**

* 根据指定的数据中心ID和机器标志ID生成指定的序列号

* @param dataCenterId 数据中心ID

* @param machineId 机器标志ID

*/

public SnowFlake(long dataCenterId, long machineId) {

if (dataCenterId MAX_DATA_CENTER_NUM || dataCenterId 0) {

throw new IllegalArgumentException("DtaCenterId can't be greater than MAX_DATA_CENTER_NUM or less than 0!");

}

if (machineId MAX_MACHINE_NUM || machineId 0) {

throw new IllegalArgumentException("MachineId can't be greater than MAX_MACHINE_NUM or less than 0!");

}

this.dataCenterId = dataCenterId;

this.machineId = machineId;

}

/**

* 产生下一个ID

* @return

*/

public synchronized long nextId() {

long currTimeStamp = getNewTimeStamp();

if (currTimeStamp lastTimeStamp) {

throw new RuntimeException("Clock moved backwards. Refusing to generate id");

}

if (currTimeStamp == lastTimeStamp) {

//相同毫秒内,序列号自增

sequence = (sequence + 1) MAX_SEQUENCE;

//同一毫秒的序列数已经达到最大

if (sequence == 0L) {

currTimeStamp = getNextMill();

}

} else {

//不同毫秒内,序列号置为0

sequence = 0L;

}

lastTimeStamp = currTimeStamp;

return (currTimeStamp - START_TIMESTAMP) TIMESTAMP_LEFT //时间戳部分

| dataCenterId DATA_CENTER_LEFT //数据中心部分

| machineId MACHINE_LEFT //机器标识部分

| sequence; //序列号部分

}

private long getNextMill() {

long mill = getNewTimeStamp();

while (mill = lastTimeStamp) {

mill = getNewTimeStamp();

}

return mill;

}

private long getNewTimeStamp() {

return System.currentTimeMillis();

}

public static void main(String[] args) {

SnowFlake snowFlake = new SnowFlake(2, 3);

for (int i = 0; i (1 4); i++) {

//10进制

Long id = snowFlake.nextId();

//62进制

String convertedNumStr = NumericConvertUtils.toOtherNumberSystem(id, 62);

//10进制转化为62进制

System.out.println("10进制:" + id + " 62进制:" + convertedNumStr);

//TODO 执行具体的存储操作,可以存放在Redis等中

//62进制转化为10进制

System.out.println("62进制:" + convertedNumStr + " 10进制:" + NumericConvertUtils.toDecimalNumber(convertedNumStr, 62));

System.out.println();

}

}

}

//生成结果:

10进制:185784275776581632 62进制:dITqmhW2

c语言代码怎么弄个链接点击就运行

开发一个c语言程序要经过哪四个步骤

开发一个C语言程序需要经过的四个步骤:编辑、编译、连接、运行。

C语言程序可以使用在任意架构的处理器上,只要那种架构的处理器具有对应的C语言编译器和库,然后将C源代码编译、连接成目标二进制文件之后即可运行。

1、预处理:输入源程序并保存(.C文件)。

2、编译:将源程序翻译为目标文件(.OBJ文件)。

3、链接:将目标文件生成可执行文件(.EXE文件)。

4、运行:执行.EXE文件,得到运行结果。

扩展资料:

C语言代码变为程序的几个阶段:

1、首先是源代码文件test.c和相关的头文件,如stdio.h等被预处理器cpp预处理成一个.i文件。经过预编译后的.i文件不包含任何宏定义,因为所有的宏已经被展开,并且包含的文件也已经被插入到.i文件中。

2、编译过程就是把预处理完的文件进行一系列的词法分析、语法分析、语义分析以及优化后产生相应的汇编代码文件,这个过程往往是我们所说的整个程序的构建的核心部分,也是最复杂的部分之一。

3、汇编器不直接输出可执行文件而是输出一个目标文件,汇编器可以调用ld产生一个能够运行的可执行程序。即需要将一大堆文件链接起来才可以得到“a.out”,即最终的可执行文件。

4、在链接过程中,对其他定义在目标文件中的函数调用的指令需要被重新调整,对实用其他定义在其他目标文件的变量来说,也存在同样问题。

参考资料来源:百度百科-c语言

c语言中的编辑,编译,连接,运行分别是什么意思

编辑就是对代码的编写,按照c语言规则,编写完成一定功能的代码。

编译就是对代码进行编译,让代码从高级语言编译成可以让电脑识别运算的机器码。

连接就是对代码各个函数等进行,连接

运行就是运行所编辑代码组成的程序。

编辑,编译和运行C程序需要什么条件?

c程序的编辑,编译,链接和运行

编辑

对于C语言来说,任何文本编辑器都是可以的;windows自带的notepad,linux常用VIM都可以

编译,链接

虽然这是两个步骤,但通常是同一套tool,例如开源的gcc系列,微软的visual C++都有自己的编译链接工具。

运行

一旦编译链接完成通常就可以在目标机器上运行了;如果使用了动态库,还需要运行环境里有对应的库文件才行。

c语言编辑编译链接运行,c语言如何编译运行

C语言编辑编译连接的作用是什么

C语言编辑的作用是检查语法,制作C语言的源文件和头文件,生成汇编代码。

C语言编辑的作用是将汇编代码转换机器码。在这一步中,会对文件内部的语法语义做处理,如果编译出错,无法进行后续动作。

C语言链接的作用是将机器码链接到一起生成可执行程序。这一步会对文件之间的关联做检查,如果出错,将不会生成可执行程序,也就无法执行。

扩展资料:

C语言链接时,将源文件中用到的库函数与汇编生成的目标文件.o合并生成可执行文件。该可执行文件会变大很多,一般是调用自己电脑上的静态库。

静态库和应用程序编译在一起,在任何情况下都能运行,而动态库是动态链接,文件生效时才会调用。很多代码编译通过,链接失败就极有可能在静态库和动态库这出现了纰漏,要视情况解决。缺少相关所需文件,就会链接报错。这个时候就要检查下本地的链接库是不是缺损。

C语言文件的编译与执行的四个阶段并分别描述

开发C程序有四个步骤:编辑、编译、连接和运行。

任何一个体系结构处理器上都可以使用C语言程序,只要该体系结构处理器有相应的C语言编译器和库,那么C源代码就可以编译并连接到目标二进制文件上运行。

1、预处理:导入源程序并保存(C文件)。

2、编译:将源程序转换为目标文件(Obj文件)。

3、链接:将目标文件生成为可执行文件(EXE文件)。

4、运行:执行,获取运行结果的EXE文件。

扩展资料:

将C语言代码分为程序的几个阶段:

1、首先,源代码文件测试。以及相关的头文件,比如stdio。H、由预处理器CPP预处理为.I文件。预编译的。文件不包含任何宏定义,因为所有宏都已展开,并且包含的文件已插入。我归档。

2、编译过程是对预处理文件进行词法分析、语法分析、语义分析和优化,生成相应的汇编代码文件。这个过程往往是整个程序的核心部分,也是最复杂的部分之一。

3、汇编程序不直接输出可执行文件,而是输出目标文件。汇编程序可以调用LD来生成可以运行的可执行程序。也就是说,您需要链接大量的文件才能获得“a.out”,即最终的可执行文件。

4、在链接过程中,需要重新调整其他目标文件中定义的函数调用指令,而其他目标文件中定义的变量也存在同样的问题。

参考资料来源:百度百科-c语言

短链接生成系统源码的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于短链接生成算法、短链接生成系统源码的信息别忘了在本站进行查找喔。

1、本网站名称:源码村资源网
2、本站永久网址:https://www.yuanmacun.com
3、本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理。
4、本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6、本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
源码村资源网 » 短链接生成系统源码(短链接生成算法)

1 评论

您需要 登录账户 后才能发表评论

发表评论

欢迎 访客 发表评论