Chapter 26《Extractors》

  • 到目前为止所使用的模式匹配的拆解和匹配都建立在case class的基础上,如果要创建自己的模式而不定义case class,提取器提供了一种实现手段。

提取器

  • Scala中,只要有一个object拥有unapply的方法,该object就被称为提取器,这个unapply的作用是跟selector进行匹配,如果匹配成功,就将其拆解开来。
object EMail {
// The injection method (optional)
def apply(user: String, domain: String) = user + "@" + domain
// The extraction method (mandatory)
def unapply(str: String): Option[(String, String)] = {
val parts = str split "@"
if (parts.length == 2) Some(parts(0), parts(1)) else None
}
}

定义了一个名为EMail的提取器。unapply方法是apply方法的逆操作,unapply的入参为email地址,返回userdomain,但是为了处理字符串不是email的情况,将unapply的返回值定义为Option类型。在模式匹配中,如果case后面遇到了提取器,就调用unapply方法,其入参是选择表达式。

selectorString match { case EMail(user, domain) => ... }
EMail.unapply(selectorString)

unapply方法的返回值必须是Option类型的。这里的case Email(param1)模式,如果没有定义apply方法,有两种写法,第一种是Email(param1),这个param1unapply返回的整个元组;第二种就是Email(param1, param2, ……),参数的个数和unapply定义的返回参数个数相同。定义了apply方法也是同样的情况。

目前选择器selectorString的类型和提取器unapply的参数类型是一致的,都是String,但这并不是必须的,selectorString可以为任何类型,unapply会首先检查selectorString的类型是不是String类型的,applyunapply是对偶的,如果两者存在于一个对象中的话,Email.unapply(Email.apply(user, domain))的返回值是Some(user, domain)apply使用参数来构建对象,unapply将对象解析为构造参数。推荐将两者放在一起。


0个或者1个变量的模式

  • 如果返回多个模式元素,可将这个元素放在元组中,并使用Some包裹起来进行返回,如果要返回单个元素,直接使用Some将这个元素进行包装。如果不返回元素,则返回布尔值。
object UpperCase {
def unapply(s: String): Boolean = s.toUpperCase == s
}

case EMail(Twice(x @ UpperCase()), domain)中含有三个unapply模式。UpperCase()要带上,不然匹配的就是UpperCase自身的类型。UpperCase自身虽然没有绑定任何变量,但可以使用变量绑定@将跟它匹配的模式关联一个变量,DIDI@xiaomi.com返回的x就是DI,可见嵌套的模式匹配是从最外层进行的。


提取可变长度参数的模式

如何使用提取器支持下面的代码:

dom match {
case Domain("org", "acm") => println("acm.org")
case Domain("com", "sun", "java") => println("java.sun.com")
case Domain("net", _*) => println("a .net domain")
}

就是一个提取器可生成多个匹配模式,使用unapplySeq方法。

def unapplySeq(whole: String): Option[Seq[String]] Some(whole.split("\\.").reverse)

返回的是Option[Seq[String]]类型。

def unapplySeq(email: String): Option[(String, Seq[String])] 

既能够返回固定元素String,也能够返回不定元素,不定元素需要写在最后面。这里的Seq也可以换成List,Array,IndexedSeq等。


提取器和序列模式

  • 列表模式其实就是在List中存在一个unapplySeq方法。SetMap应该是不可以的。因为在比较的时候是有序的。

提取器和样例类的比较

  • 样例类将数据的具体实现细节暴露给了使用方。在能够正确匹配构造器模式的情况下,选择器selector的具体实现细节是暴露的。
  • 提取器则隐藏了数据的具体实现,既可以使用模式匹配又可以隐藏,模式可以跟数据类型无关,这种特性称之为表现独立,在大型的开发系统中是非常有必要的,可以更改实现细节而不影响客户端的实现。
  • 表现独立是提取器相对于样例类一个重要的优势,样例类相对于提取器的优点主要有:样例类更好实现,编译器可以更好的优化,因为case class的实现是固定的,但是提取器中可以写任何代码,最后,如果case class继承自sealed trait或者sealed class,则在进行模式匹配的时候编译器可以帮助检查所有的情况。
  • 如果是封闭的应用,则使用样例类是更好的,因为方便,还可以提供静态检查;如果类的继承关系是需要改变的,且需要暴露给使用方,提取器是不错的选择,保持了表现独立。

正则表达式

  • 提取器的另外一个应用场景是正则表达式,ScalaJava一样,通过一个类库来提供对正则表达式的支持。
  • scala的正则表达式支持在scala.util.matching中。新的正则表达式是将一个字符串传递给Regex构造方法来完成的,在String中需要对特殊字符进行转义。也可以直接在""""""中写入原生字符串,比如"""(-)?(\d+)(\.\d*)?"""
scala> val Decimal = new Regex("""(-)?(\d+)(\.\d*)?""")

或者 val Decimal = """(-)?(\d+)(\.\d*)?""".r,因为在StringOps中存在一个名为r的方法可以生成Regex表达式。

查找正则表达式
  • 可以使用不同的操作符,在字符串中查找正确的正则表达式
      1. regex findFirstIn str,在str中查找regex,返回Option类型;
      1. regex findAllIn str,在str中查找regex,返回Iterator类型;
      1. regex findPrefixOf str,在str的一开始查找regex,返回Option类型。
使用正则表达式提取信息
  • 每一个正则表达式都有对应的提取器,用来表示正则表达式中匹配的字符串。
scala> val Decimal(sign, integerpart, decimalpart) = "-1.23"
sign: String = -
integerpart: String = 1
decimalpart: String = .23

可绑定的变量是正则表达式中的各个组。

  • 提取器泛化了模式匹配,允许定义自己的模式,并不需要跟selector的类型相关,同时提取器在模式和数据的具体表现形式之间增加了一层保护层,使得大型软件的实现更为灵活,保持了表现独立性。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351

推荐阅读更多精彩内容