page contents

PHP通过KMP算法实现strpos

以下内容希望帮助到大家!

attachments-2020-03-lH14W94f5e7ab6b2903ee.jpg

昨天看了阮一峰老师的一篇博客《字符串匹配的KMP算法》,讲的非常棒。这篇文章也是解决了:

有一个字符串"BBC ABCDAB ABCDABCDABDE",里面是否包含另一个字符串"ABCDABD"?

后来发现,其实这不是就PHP自带函数strpos的功能吗?于是突发奇想,自己写个类,实现一下这个算法。

代码

<?php

class KMP
{
    public  $haystack;
    public  $needle;
    private $_haystackLen;
    private $_needleLen;
    private $_matchTable;
    private $_isMatch;

    //构造函数
    function __construct($haystack,$needle)
    {
        $this->haystack      = $haystack;
        $this->needle        = $needle;
    }

    //初始化一些参数
    private function init(){
        $this->_haystackLen  = $this->getLen($this->haystack);
        $this->_needleLen    = $this->getLen($this->needle);
        $this->_matchTable   = $this->getMatchTable();
        $this->_isMatch = false;

    }

    //类似strpos函数功能
    public function strpos()
    {
        $this->init();

        //haystack
        $haystackIdx  = $matchNum = 0;
        while ($haystackIdx <= $this->_haystackLen - $this->_needleLen){
            //needle
            $needIdx = 0;
            for (; $needIdx < $this->_needleLen; $needIdx++){
                if (strcmp($this->haystack[$haystackIdx],$this->needle[$needIdx]) <> 0){
                    if ($matchNum > 0){
                        $lastMatchValue = $this->getLastMatchValue($needIdx-1);
                        $haystackIdx   += $this->getStep($matchNum,$lastMatchValue);
                        $matchNum = 0;
                    } else {
                        $haystackIdx++;
                    }
                    break;
                } else {
                    $haystackIdx++;
                    $matchNum++;
                    if ($matchNum == $this->_needleLen){
                        $this->_isMatch = true;
                        break;
                    }
                }
            }
            if($this->_isMatch == true){
                break;
            }
        }
        return $this->_isMatch ? $haystackIdx - $this->_needleLen : false;
    }

    //获取字符长度
    private function getLen($str)
    {
       return mb_strlen($str,'utf-8');
    }

    //获取部分匹配表
    private function getMatchTable()
    {
        $matchTable = [];
        for ($i=0; $i < $this->_needleLen; $i++){
            $intersectLen = 0;
            $nowStr = mb_substr($this->needle,0,$i + 1,'utf-8');
            $preFixArr = $this->getPreFix($nowStr);
            $sufFixArr = $this->getSufFix($nowStr);
            if($preFixArr && $sufFixArr){
                $intersectArr = array_intersect($preFixArr,$sufFixArr);
                if (!empty($intersectArr)){
                    $intersect = array_pop($intersectArr);
                    $intersectLen = mb_strlen($intersect,'utf-8');
                }
            }
            $matchTable[$i] = $intersectLen;
        }
        return $matchTable;
    }

    //获取前缀数组
    private function getPreFix($str)
    {
        $outArr = [];
        $strLen = $this->getLen($str);
        if ($strLen > 1){
            for ($i = 1;$i < $strLen; $i++){
               $outArr[] = mb_substr($str,0,$i,'utf-8');
            }
        }
        return $outArr;
    }

    //获取后缀数组
    private function getSufFix($str)
    {
        $outArr = [];
        $strLen = $this->getLen($str);
        if ($strLen > 1){
            for ($i = 1;$i < $strLen; $i++){
                $outArr[] = mb_substr($str,$i,null,'utf-8');
            }
        }
        return $outArr;
    }

    //计算步长
    private function getStep($matchNum,$lastMatchValue)
    {
        return $matchNum - $lastMatchValue;
    }

    //获取最后匹配值
    private function getLastMatchValue($index)
    {
        return isset($this->_matchTable[$index]) ? $this->_matchTable[$index] : 0;
    }
}
$str = 'BBC ABCDAB ABCDABCDABDE';
$subStr = 'ABCDABD';
$kmp = new KMP($str,$subStr);
var_dump($kmp->strpos());
$kmp->haystack = 'i believe';
$kmp->needle   = 'lie';
var_dump($kmp->strpos());
$kmp->haystack = 'i love u';
$kmp->needle   = 'hate';
var_dump($kmp->strpos());


attachments-2020-03-oYPKrQa75e7ab626c990d.jpg

  • 发表于 2020-03-25 09:41
  • 阅读 ( 473 )
  • 分类:PHP开发

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
Pack
Pack

1135 篇文章

作家榜 »

  1. 轩辕小不懂 2403 文章
  2. 小柒 1470 文章
  3. Pack 1135 文章
  4. Nen 576 文章
  5. 王昭君 209 文章
  6. 文双 71 文章
  7. 小威 64 文章
  8. Cara 36 文章