第1.6节 最长不重复子串

创建于2017-3-10
原文链接:https://leetcode.com/problems/longest-substring-without-repeating-characters/?tab=Description

1 题目

Given a string, find the length of the longest substring without repeating characters.

Examples:

Given "abcabcbb", the answer is "abc", which the length is 3.

Given "bbbbb", the answer is "b", with the length of 1.

Given "pwwkew", the answer is "wke", with the length of 3. Note that the answer must be a substring, "pwke" is a subsequence and not a
substring.

2 题解

class Solution(object):
    def lengthOfLongestSubstring(self, s):
        """
        :type s: str
        :rtype: int
        """
        if len(s) <= 1:
            return len(s)
        start,m_start,m_end=0,0,0
        c_dic={s[0]:0}  #记录每个字符的位置
        
        for end in range(1,len(s)):  #err1:注意边界条件
            #print end
            pos = c_dic.get(s[end],-1)
            #print "pos[%s]=%s" % (s[end],pos)
            
            if pos != -1:
                m_len=m_end-m_start+1
                c_len=end-1-start+1  
                
                if c_len > m_len:
                    m_start=start
                    m_end=end-1  #当前字符要排除掉
                
                old_start=start
                start=c_dic[s[end]]+1    
                for i in range(old_start, start):  #不能从0开始清理,否则会有误清理
                    c_dic[s[i]]=-1
                c_dic[s[end]]=end   #err2:清空字典后,起点start要记得赋值
            
            elif end==len(s)-1:
                m_len=m_end-m_start+1
                c_len=end-start+1  
                if c_len > m_len:
                    m_start=start
                    m_end=end  #err3:接受当前end位置的字符,这是为了针对循环到最后一个字符的情况。
                    
            c_dic[s[end]]=end  #插入字符    
            #print "m_start=%s,m_end=%s,start=%s,end=%s,pos[%s]=%s" % (m_start,m_end,start,end,s[end],c_dic[s[end]])
            end+=1
        
        
        return m_end-m_start+1

这段代码,我改了很多遍,测试用例总是通不过。需要考虑许多边界条件,如注释所示的err*,是代码调试中发现出错的地方。
总得来说,仅仅是accept,但是代码不够简洁,逻辑也不是很清晰,出错率很高。

3 解析

1,用快慢指针start,end来记录当前的不重复子串。
2,每次判断当前子串是否最长,如果是,则更新最长串
3,其中用到哈希表dict来记录字符是否出现过,并在子串更新时用O(k)的时间更新hash表。总的时间复杂度应该是O(N^2)

4 扩展

扩展部分主要是参考网上的题解和解析

方法一:暴力算法

Approach #1 Brute Force [Time Limit Exceeded]
用i,j两个下标迭代所有的子串,然后逐个判断是否重复,并更新最长串。
这里有个知识点,习惯上都是开区间到闭区间的方式:[i,j)

Paste_Image.png

时间复杂度:O(N^3)
空间复杂度:O(K)

方法二:滑动窗口法

Approach #2 Sliding Window [Accepted]

这个方法和我的解法思路一样。但是比我的代码逻辑更清晰,不需要在一个循环中嵌套k次清理集合的操作。相反,仅仅是在一次循环中固定滑动一个O(1)的窗口位置。所以这是一个O(N)复杂度的算法。逻辑清晰,就不容易出现错误,不像我之前的代码需要反复调试bug。
时间复杂度:O(N)
空间复杂度:O(K)

修正后的python代码如下:

class Solution(object):
    def lengthOfLongestSubstring(self, s):
        """
        :type s: str
        :rtype: int
        """
        n=len(s)
        set={}
        ans,i,j=0,0,0
        
        while(i<n and j <n):
            pos = set.get(s[j],-1)
            if(pos==-1):
                set[s[j]]=j
                j+=1   #越过当前字符,到下一个位置
                ans=max(ans, j-i)
            else:
                set[s[i]]=-1  #从集合中排除掉已经遍历的字符,一直到当前j不在集合中为止
                i+=1
        return ans

知识点

  • 滑动窗口(双指针)遍历的一种方法,用两个变量作为while循环条件,然后在循环体中控制指针移动。

代码很少,而且一次就通过测试,无bug。

方法三:滑动窗口法升级版

Approach #3 Sliding Window Optimized [Accepted]
在我的解答里面其实已经用到了,就是当找到重复的j时,新的非重复串一定是从上一个j+1开始,这样才能不包含重复的j。于是i的新值可以计算出来。但也不需要像我的代码那样,做O(k)次清理集合的操作,而是把每个出现的字符位置记下来,找到最大那个就可以了。
时间复杂度:O(N)
空间复杂度:O(K)

修正后的python代码如下:

class Solution(object):
    def lengthOfLongestSubstring(self, s):
        """
        :type s: str
        :rtype: int
        """
        n=len(s)
        set={}
        ans,i,j=0,0,0
        
        while(i<n and j <n):
            pos = set.get(s[j],-1)
            if(pos==-1 or pos < i): #由于上一个j的位置有记录,因此如果该位置在i之前,则认为i之后是不含该字符的。
                set[s[j]]=j
                j+=1   #越过当前字符,到下一个位置
                ans=max(ans, j-i)
            else:
                i=pos+1
        return ans
        

和原文的java代码有一定的出入,这里直接利用dict保留了最新的字符位置,而不必采用map来做。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容