Scala Actor并发编程模型_scala简单的并发编程模型-程序员宅基地

技术标签： scala Scala

Scala Actor并发编程模型

1. Actor介绍

Scala中的Actor并发编程模型可以用来开发比Java线程效率更高的并发程序。我们学习Scala Actor的目的主要是为后续学习Akka做准备。

1.1 Java并发编程的问题

在Java并发编程中，每个对象都有一个逻辑监视器（monitor），可以用来控制对象的多线程访问。我们添加sychronized关键字来标记，需要进行同步加锁访问。这样，通过加锁的机制来确保同一时间只有一个线程访问共享数据。但这种方式存在资源争夺、以及死锁问题，程序越大问题越麻烦。

线程死锁

在这里插入图片描述

1.2 Actor并发编程模型

Actor并发编程模型，是Scala提供给程序员的一种与Java并发编程完全不一样的并发编程模型，是一种基于事件模型的并发机制。Actor并发编程模型是一种不共享数据，依赖消息传递的一种并发编程模式，有效避免资源争夺、死锁等情况。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UINgnIsn-1595649814995)(pictures/1552787528554.png)]

1.3 Java并发编程对比Actor并发编程

Java内置线程模型	Scala Actor模型
"共享数据-锁"模型 (share data and lock)	share nothing
每个object有一个monitor，监视线程对共享数据的访问	不共享数据，Actor之间通过Message通讯
加锁代码使用synchronized标识
死锁问题
每个线程内部是顺序执行的	每个Actor内部是顺序执行的

注意:

scala在2.11.x版本中加入了Akka并发编程框架，老版本已经废弃。

Actor的编程模型和Akka很像，我们这里学习Actor的目的是为学习Akka做准备。

2. 创建Actor

我们可以通过类(class)或者单例对象(object), 继承Actor特质的方式, 来创建Actor对象.

2.1 步骤

定义class或object继承Actor特质
重写act方法
调用Actor的start方法执行Actor

注意: 每个Actor是并行执行的, 互不干扰.

2.2 案例一: 通过class实现

需求

创建两个Actor，一个Actor打印1-10，另一个Actor打印11-20
使用class继承Actor实现.（如果需要在程序中创建多个相同的Actor）

参考代码

import scala.actors.Actor

//案例:Actor并发编程入门, 通过class创建Actor
object ClassDemo01 {

  //需求: 创建两个Actor，一个Actor打印1-10，另一个Actor打印11-20
  //1. 创建Actor1, 用来打印1~10的数字.
  class Actor1 extends Actor {
    override def act(): Unit = for (i <- 1 to 10) println("actor1: " + i)
  }

  //2. 创建Actor2, 用来打印11~20的数字.
  class Actor2 extends Actor {
    override def act(): Unit = for (i <- 11 to 20) println("actor2: " + i)
  }

  def main(args: Array[String]): Unit = {
    //3. 启动两个Actor.
    new Actor1().start()
    new Actor2().start()
  }
}

2.3 案例二: 通过object实现

需求

创建两个Actor，一个Actor打印1-10，另一个Actor打印11-20
使用object继承Actor实现.（如果在程序中只创建一个Actor）

参考代码

import scala.actors.Actor

//案例:Actor并发编程入门, 通过object创建Actor
object ClassDemo02 {
  //需求: 创建两个Actor，一个Actor打印1-10，另一个Actor打印11-20

  //1. 创建Actor1, 用来打印1~10的数字.
  object Actor1 extends Actor {
    override def act(): Unit = for (i <- 1 to 10) println("actor1: " + i)
  }

  //2. 创建Actor2, 用来打印11~20的数字.
  object Actor2 extends Actor {
    override def act(): Unit = for (i <- 11 to 20) println("actor2: " + i)
  }

  def main(args: Array[String]): Unit = {
    //3. 启动两个Actor.
   Actor1.start()
   Actor2.start()
  }
}

2.4 Actor程序运行流程

调用start()方法启动Actor
自动执行act()方法
向Actor发送消息
act方法执行完成后，程序会调用**exit()**方法结束程序执行.

3. 发送消息/接收消息

我们之前介绍Actor的时候，说过Actor是基于事件（消息）的并发编程模型，那么Actor是如何发送消息和接收消息的呢？

3.1 使用方式

3.1.1 发送消息

我们可以使用三种方式来发送消息：

！	发送异步消息，没有返回值
!?	发送同步消息，等待返回值
!!	发送异步消息，返回值是Future[Any]

例如：要给actor1发送一个异步字符串消息，使用以下代码：

actor1 ! "你好!"

3.1.2 接收消息

Actor中使用receive方法来接收消息，需要给receive方法传入一个偏函数

{
    case 变量名1:消息类型1 => 业务处理1
    case 变量名2:消息类型2 => 业务处理2
    ...
}

注意: receive方法只接收一次消息，接收完后继续执行act方法

3.2 案例一: 发送及接收一句话

需求

创建两个Actor（ActorSender、ActorReceiver）
ActorSender发送一个异步字符串消息给ActorReceiver
ActorReceiver接收到该消息后，打印出来

参考代码

//案例: 采用 异步无返回的形式, 发送消息.
object ClassDemo03 {
  //1. 创建发送消息的Actor, ActorSender, 发送一句话给ActorReceiver
  object ActorSender extends Actor {
    override def act(): Unit = {
      //发送一句话给ActorReceiver
      ActorReceiver ! "你好啊, 我是ActorSender!"

      //发送第二句话
      ActorReceiver ! "你叫什么名字呀? "
    }
  }

  //2. 创建接收消息的Actor, ActorReceiver
  object ActorReceiver extends Actor {
    override def act(): Unit = {
      //接收发送过来的消息.
      receive {
        case x: String => println(x)
      }
    }
  }

  def main(args: Array[String]): Unit = {
    //3. 启动两个Actor
    ActorSender.start()
    ActorReceiver.start()
  }
}

3.3 案例二: 持续发送和接收消息

如果我们想实现ActorSender一直发送消息, ActorReceiver能够一直接收消息，该怎么实现呢？

答: 我们只需要使用一个while(true)循环，不停地调用receive来接收消息就可以啦。

需求

创建两个Actor（ActorSender、ActorReceiver）
ActorSender持续发送一个异步字符串消息给ActorReceiver
ActorReceiver持续接收消息，并打印出来

参考代码

//案例:Actor 持续发送和接收消息.
object ClassDemo04 {
  //1. 创建发送消息的Actor, ActorSender, 发送一句话给ActorReceiver
  object ActorSender extends Actor {
    override def act(): Unit = {
        while(true) {
          //发送一句话给ActorReceiver
          ActorReceiver ! "你好啊, 我是ActorSender!"
          //休眠3秒.
          TimeUnit.SECONDS.sleep(3)       //单位是: 秒
        }
    }
  }

  //2. 创建接收消息的Actor, ActorReceiver
  object ActorReceiver extends Actor {
    override def act(): Unit = {
      //接收发送过来的消息,  持续接收.
      while(true) {
        receive {
          case x: String => println(x)
        }
      }
    }
  }

  def main(args: Array[String]): Unit = {
    //3. 启动两个Actor
    ActorSender.start()
    ActorReceiver.start()
  }
}

3.4 案例三: 优化持续接收消息

上述代码，是用while循环来不断接收消息的, 这样做可能会遇到如下问题:

如果当前Actor没有接收到消息，线程就会处于阻塞状态
如果有很多的Actor，就有可能会导致很多线程都是处于阻塞状态
每次有新的消息来时，重新创建线程来处理
频繁的线程创建、销毁和切换，会影响运行效率

针对上述情况, 我们可以使用loop(), 结合react()来复用线程, 这种方式比while循环 + receive()更高效.

需求

创建两个Actor（ActorSender、ActorReceiver）
ActorSender持续发送一个异步字符串消息给ActorReceiver
ActorReceiver持续接收消息，并打印出来

注意: 使用loop + react重写上述案例.

参考代码

//案例: 使用loop + react循环接收消息.
object ClassDemo05 {

  //1. 创建发送消息的Actor, ActorSender, 发送一句话给ActorReceiver
  object ActorSender extends Actor {
    override def act(): Unit = {
      while(true) {
        //发送一句话给ActorReceiver
        ActorReceiver ! "你好啊, 我是ActorSender!"
        //休眠3秒.
        TimeUnit.SECONDS.sleep(3)       //单位是: 秒
      }
    }
  }

  //2. 创建接收消息的Actor, ActorReceiver
  object ActorReceiver extends Actor {
    override def act(): Unit = {
      //接收发送过来的消息,  持续接收.
      loop{
        react {
          case x: String => println(x)
        }
      }
    }
  }

  def main(args: Array[String]): Unit = {
    //3. 启动两个Actor
    ActorSender.start()
    ActorReceiver.start()
  }
}

3.5 案例四: 发送和接收自定义消息

我们前面发送的消息都是字符串类型，Actor中也支持发送自定义消息，例如：使用样例类封装消息，然后进行发送处理。

3.5.1 示例一: 发送同步有返回消息

需求

创建一个MsgActor，并向它发送一个同步消息，该消息包含两个字段（id、message）
MsgActor回复一个消息，该消息包含两个字段（message、name）
打印回复消息

注意:

使用!?来发送同步消息

在Actor的act方法中，可以使用sender获取发送者的Actor引用

参考代码

//案例: Actor发送和接收自定义消息, 采用 同步有返回的形式
object ClassDemo06 {

  //1. 定义两个样例类Message(表示发送数据),   ReplyMessage(表示返回数据.)
  case class Message(id: Int, message: String) //自定义的发送消息 样例类
  case class ReplyMessage(message: String, name: String) //自定义的接收消息 样例类


  //2. 创建一个MsgActor，用来接收MainActor发送过来的消息, 并向它回复一条消息.
  object MsgActor extends Actor {
    override def act(): Unit = {
      //2.1 接收 主Actor(MainActor) 发送过来的消息.
      loop {
        react {
          //结合偏函数使用
          case Message(id, message) => println(s"我是MsgActor, 我收到的消息是: ${id}, ${message}")

          //2.2 给MainActor回复一条消息.
          //sender: 获取消息发送方的Actor对象
          sender ! ReplyMessage("我很不好, 熏死了!...", "车磊")
        }
      }
    }
  }

  def main(args: Array[String]): Unit = {
    //3. 开启MsgActor
    MsgActor.start()

    //4. 通过MainActor, 给MsgActor发送一个 Message对象.
    //采用 !?  同步有返回.
    val reply:Any = MsgActor !? Message(1, "你好啊, 我是MainActor, 我在给你发消息!")
    //resutl表示最终接收到的 返回消息.
    val result = reply.asInstanceOf[ReplyMessage]
    //5. 输出结果.
    println(result)
  }
}

3.5.2 示例二: 发送异步无返回消息

需求

创建一个MsgActor，并向它发送一个异步无返回消息，该消息包含两个字段（id, message）

注意: 使用!发送异步无返回消息

参考代码

//案例: Actor发送和接收自定义消息, 采用 异步 无返回的形式
object ClassDemo07 {

  //1. 定义一个样例类Message(表示发送数据)
  case class Message(id: Int, message: String) //自定义的发送消息 样例类

  //2. 创建一个MsgActor，用来接收MainActor发送过来的消息, 并打印.
  object MsgActor extends Actor {
    override def act(): Unit = {
      //2.1 接收 主Actor(MainActor) 发送过来的消息.
      loop {
        react {
          //结合偏函数使用
          case Message(id, message) => println(s"我是MsgActor, 我收到的消息是: ${id}, ${message}")
        }
      }
    }
  }

  def main(args: Array[String]): Unit = {
    //3. 开启MsgActor
    MsgActor.start()

    //4. 通过MainActor, 给MsgActor发送一个 Message对象.
    //采用 !  异步无返回
   MsgActor ! Message(1, "我是采用 异步无返回 的形式发送消息!")

  }
}

3.5.3 示例三: 发送异步有返回消息

需求

创建一个MsgActor，并向它发送一个异步有返回消息，该消息包含两个字段（id、message）
MsgActor回复一个消息，该消息包含两个字段（message、name）
打印回复消息

注意:

使用!!发送异步有返回消息

发送后，返回类型为Future[Any]的对象

Future表示异步返回数据的封装，虽获取到Future的返回值，但不一定有值，可能在将来某一时刻才会返回消息

Future的isSet()可检查是否已经收到返回消息，apply()方法可获取返回数据

参考代码

//案例: Actor发送和接收自定义消息, 采用 异步有返回的形式
object ClassDemo08 {

  //1. 定义两个样例类Message(表示发送数据),   ReplyMessage(表示返回数据.)
  case class Message(id: Int, message: String) //自定义的发送消息 样例类
  case class ReplyMessage(message: String, name: String) //自定义的接收消息 样例类


  //2. 创建一个MsgActor，用来接收MainActor发送过来的消息, 并向它回复一条消息.
  object MsgActor extends Actor {
    override def act(): Unit = {
      //2.1 接收 主Actor(MainActor) 发送过来的消息.
      loop {
        react {
          //结合偏函数使用
          case Message(id, message) => println(s"我是MsgActor, 我收到的消息是: ${id}, ${message}")

            //2.2 给MainActor回复一条消息.
            //sender: 获取消息发送方的Actor对象
            sender ! ReplyMessage("我很不好, 熏死了!...", "糖糖")
        }
      }
    }
  }

  def main(args: Array[String]): Unit = {
    //3. 开启MsgActor
    MsgActor.start()

    //4. 通过MainActor, 给MsgActor发送一个 Message对象.
    //采用 !!  异步有返回.
    val future: Future[Any] = MsgActor !! Message(1, "你好啊, 我是MainActor, 我在给你发消息!")

    //5. 因为future中不一定会立马有数据, 所以我们要校验.
    //Future的isSet()可检查是否已经收到返回消息，apply()方法可获取返回数据
    //!future.isSet表示: 没有接收到具体的返回消息, 就一直死循环.
    while(!future.isSet){}

    //通过Future的apply()方法来获取返回的数据.
    val result = future.apply().asInstanceOf[ReplyMessage]
    //5. 输出结果.
    println(result)
  }
}

4. 案例: WordCount

4.1 需求

接下来，我们要使用Actor并发编程模型实现多文件的单词统计。

案例介绍

给定几个文本文件（文本文件都是以空格分隔的），使用Actor并发编程来统计单词的数量.

思路分析

实现思路

MainActor获取要进行单词统计的文件
根据文件数量创建对应的WordCountActor
将文件名封装为消息发送给WordCountActor
WordCountActor接收消息，并统计单个文件的单词计数
将单词计数结果发送给MainActor
MainActor等待所有的WordCountActor都已经成功返回消息，然后进行结果合并

4.2 步骤一: 获取文件列表

实现思路

在当前项目下的data文件夹下有: 1.txt, 2.txt两个文本文件, 具体存储内容如下:
1.txt文本文件存储内容如下:
```
hadoop sqoop hadoop
hadoop hadoop flume
hadoop hadoop hadoop
spark
```
2.txt文本文件存储内容如下:
```
flink hadoop hive
hadoop sqoop hadoop
hadoop hadoop hadoop
spark
```
获取上述两个文本文件的路径, 并将结果打印到控制台上.

参考代码

object MainActor {

  def main(args: Array[String]): Unit = {
    //1. 获取所有要统计的文件的路径.
    //1.1 定义变量dir, 记录保存所有文件的: 文件夹路径.  ./data/
    var dir = "./data/"
    //1.2 获取该文件夹下, 所有的文件名.
    var fileNameList = new File(dir).list().toList //List("1.txt", "2.txt")
    //1.3 对获取到的文件名进行封装, 获取其全路径.     ./data/1.txt      ./data/2.txt
    var fileDirList = fileNameList.map(dir + _)
    //println(fileDirList)
  }
}

4.3 步骤二: 创建WordCountActor

实现思路

根据文件数量创建对应个数的WordCountActor对象.
为了方便后续发送消息给Actor，将每个Actor与文件名关联在一起

实现步骤

创建WordCountActor
将文件列表转换为WordCountActor
为了后续方便发送消息给Actor，将Actor列表和文件列表拉链到一起
打印测试

参考代码

WordCountActor.scala文件中的代码

//2.1 先创建WordCountActor类, 用来获取WordCountActor对象.
//创建WordCountActor类, 每一个WordCountActor对象, 统计一个文件.
class WordCountActor extends Actor {
  override def act(): Unit = { 
  }
}

MainActor.scala文件中的代码

object MainActor {

  def main(args: Array[String]): Unit = {
    //1. 获取所有要统计的文件的路径.
    //1.1 定义变量dir, 记录保存所有文件的: 文件夹路径.  ./data/
    var dir = "./data/"
    //1.2 获取该文件夹下, 所有的文件名.
    var fileNameList = new File(dir).list().toList //List("1.txt", "2.txt")
    //1.3 对获取到的文件名进行封装, 获取其全路径.     ./data/1.txt      ./data/2.txt
    var fileDirList = fileNameList.map(dir + _)
    //println(fileDirList)

    //2. 根据文件数量, 创建对应的WordCountActor对象.
    //2.1 先创建WordCountActor类, 用来获取WordCountActor对象.
    //2.2 根据文件数量, 创建对应的WordCountActor对象.
    val wordCountList = fileNameList.map(_ => new WordCountActor) //根据两个txt文件, 创建了两个wordCount对象.
    //println(wordCountList)
    //2.3 将WordCountActor和文件全路径关联起来
    val actorWithFile = wordCountList.zip(fileDirList) //WordCountActor -> ./data/1.txt ,  WordCountActor -> ./data/2.txt
    println(actorWithFile)
  }
}

4.4 步骤三: 启动Actor/发送/接收任务消息

实现思路

启动所有WordCountActor对象，并发送单词统计任务消息给每个WordCountActor对象.

注意: 此处应发送异步有返回消息

实现步骤

创建一个WordCountTask样例类消息，封装要进行单词计数的文件名
启动所有WordCountActor，并发送异步有返回消息
获取到所有的WordCountActor中返回的消息（封装到一个Future列表中）
在WordCountActor中接收并打印消息

参考代码

MessagePackage.scala文件中的代码

/**
  * 表示: MainActor 给每一个WordCountActor发送任务的 格式.
  * @param fileName 具体的要统计的 文件路径.
  */
case class WordCountTask(fileName:String)

MainActor.scala文件中的代码

object MainActor {

  def main(args: Array[String]): Unit = {
    //1. 获取所有要统计的文件的路径.
    //1.1 定义变量dir, 记录保存所有文件的: 文件夹路径.  ./data/
    var dir = "./data/"
    //1.2 获取该文件夹下, 所有的文件名.
    var fileNameList = new File(dir).list().toList //List("1.txt", "2.txt")
    //1.3 对获取到的文件名进行封装, 获取其全路径.     ./data/1.txt      ./data/2.txt
    var fileDirList = fileNameList.map(dir + _)
    //println(fileDirList)

    //2. 根据文件数量, 创建对应的WordCountActor对象.
    //2.1 先创建WordCountActor类, 用来获取WordCountActor对象.
    //2.2 根据文件数量, 创建对应的WordCountActor对象.
    val wordCountList = fileNameList.map(_ => new WordCountActor) //根据两个txt文件, 创建了两个wordCount对象.
    //println(wordCountList)
    //2.3 将WordCountActor和文件全路径关联起来
    val actorWithFile = wordCountList.zip(fileDirList) //WordCountActor -> ./data/1.txt ,  WordCountActor -> ./data/2.txt
    println(actorWithFile)

    //3. 启动WordCountActor, 并给每一个WordCountActor发送任务.
    /*
      Map(spark -> 1, hadoop -> 7, sqoop -> 1, flume -> 1)
      Map(sqoop -> 1, flink -> 1, hadoop -> 6, spark -> 1, hive -> 1)
     */
    val futureList: List[Future[Any]] = actorWithFile.map {       //futureList: 记录的是所有WordCountActor统计的结果.
      keyVal => //keyVal的格式: WordCountActor -> ./data/1.txt
        //3.1 获取具体的要启动的WordCountActor对象.
        val actor = keyVal._1 //actor: WordCountActor
        //3.2 启动具体的WordCountActor.
        actor.start()
        
        //3.3 给每个WordCountActor发送具体的任务(文件路径)  异步有返回.
        val future: Future[Any] = actor !! WordCountTask(keyVal._2)
        future      //记录的是某一个WordCountActor返回的统计结果.
    }
  }
}

WordCountActor.scala文件中的代码

//2.1 先创建WordCountActor类, 用来获取WordCountActor对象.
//创建WordCountActor类, 每一个WordCountActor对象, 统计一个文件.
class WordCountActor extends Actor {
  override def act(): Unit = { 
      loop {
          react {
            //3.4 接收具体的任务
            case WordCountTask(fileName) =>
              //3.5 打印具体的任务
              println(s"接收到的具体任务是: ${fileName}")
          }
      }
  }
}

4.5 步骤四: 统计文件单词计数

实现思路

读取文件文本，并统计出来单词的数量。例如：

(hadoop, 3), (spark, 1)...

实现步骤

读取文件内容，并转换为列表
按照空格切割文本，并转换为一个一个的单词
为了方便进行计数，将单词转换为元组
按照单词进行分组，然后再进行聚合统计
打印聚合统计结果

参考代码

WordCountActor.scala文件中的代码

class WordCountActor extends Actor {
  override def act(): Unit = {
    //采用loop + react 方式接收数据.
    loop {
      react {
        //3.4 接收具体的任务
        case WordCountTask(fileName) =>
          //3.5 打印具体的任务
          println(s"接收到的具体任务是: ${fileName}")

        //4. 统计接收到的文件中的每个单词的数量.
        //4.1 获取指定文件中的所有的文件. List("hadoop sqoop hadoop","hadoop hadoop flume")
        val lineList = Source.fromFile(fileName).getLines().toList
        //4.2 将上述获取到的数据, 转换成一个一个的字符串.  
        //List("hadoop", "sqoop", "hadoop","hadoop", "hadoop", "flume")
        val strList = lineList.flatMap(_.split(" "))
        //4.3 给每一个字符串后边都加上次数, 默认为1.             
        //List("hadoop"->1, "sqoop"->1, "hadoop"->1, "hadoop"->1, "flume"->1)
        val wordAndCount = strList.map(_ -> 1)
        //4.4 按照 字符串内容分组.                              
        //"hadoop" -> List("hadoop"->1, "hadoop"->1),   "sqoop" -> List("sqoop"->1)
        val groupMap = wordAndCount.groupBy(_._1)
        //4.5 对分组后的内容进行统计, 统计每个单词的总次数.    "hadoop" -> 2,   "sqoop" -> 1
        val wordCountMap = groupMap.map(keyVal => keyVal._1 -> keyVal._2.map(_._2).sum)
        //4.6 打印统计后的结果. 
        println(wordCountMap)
      }
    }
  }
}

4.6 步骤五: 返回结果给MainActor

实现思路

将单词计数的结果封装为一个样例类消息，并发送给MainActor
MainActor等待所有WordCountActor均已返回后,获取到每个WordCountActor单词计算后的结果

实现步骤

定义一个样例类封装单词计数结果
将单词计数结果发送给MainActor
MainActor中检测所有WordCountActor是否均已返回，如果均已返回，则获取并转换结果
打印结果

参考代码

MessagePackage.scala文件中的代码

/**
  * 表示: MainActor 给每一个WordCountActor发送任务的 格式.
  * @param fileName 具体的要统计的 文件路径.
  */
case class WordCountTask(fileName:String)


/**
  * 每个WordCountActor统计完的返回结果的: 格式
  * @param wordCountMap  具体的返回结果, 例如:  Map("hadoop"->6, "sqoop"->1)
  */
case class WordCountResult(wordCountMap:Map[String, Int])

WordCountActor.scala文件中的代码

class WordCountActor extends Actor {
  override def act(): Unit = {
    //采用loop + react 方式接收数据.
    loop {
      react {
        //3.4 接收具体的任务
        case WordCountTask(fileName) =>
          //3.5 打印具体的任务
          println(s"接收到的具体任务是: ${fileName}")

        //4. 统计接收到的文件中的每个单词的数量.
        //4.1 获取指定文件中的所有的文件.                       List("hadoop sqoop hadoop","hadoop hadoop flume")
        val lineList = Source.fromFile(fileName).getLines().toList
        //4.2 将上述获取到的数据, 转换成一个一个的字符串.        List("hadoop", "sqoop", "hadoop","hadoop", "hadoop", "flume")
        val strList = lineList.flatMap(_.split(" "))
        //4.3 给每一个字符串后边都加上次数, 默认为1.             List("hadoop"->1, "sqoop"->1, "hadoop"->1,"hadoop"->1, "hadoop"->1, "flume"->1)
        val wordAndCount = strList.map(_ -> 1)
        //4.4 按照 字符串内容分组.                              "hadoop" -> List("hadoop"->1, "hadoop"->1),   "sqoop" -> List("sqoop"->1)
        val groupMap = wordAndCount.groupBy(_._1)
        //4.5 对分组后的内容进行统计, 统计每个单词的总次数.      "hadoop" -> 2,   "sqoop" -> 1
        val wordCountMap = groupMap.map(keyVal => keyVal._1 -> keyVal._2.map(_._2).sum)
        //4.6 把统计后的结果返回给: MainActor.
        sender ! WordCountResult(wordCountMap)
      }
    }
  }
}

4.7 步骤六: 结果合并

实现思路

对接收到的所有单词计数进行合并。

参考代码

MainActor.scala文件中的代码

object MainActor {

  def main(args: Array[String]): Unit = {
    //1. 获取所有要统计的文件的路径.
    //1.1 定义变量dir, 记录保存所有文件的: 文件夹路径.  ./data/
    var dir = "./data/"
    //1.2 获取该文件夹下, 所有的文件名.
    var fileNameList = new File(dir).list().toList //List("1.txt", "2.txt")
    //1.3 对获取到的文件名进行封装, 获取其全路径.     ./data/1.txt      ./data/2.txt
    var fileDirList = fileNameList.map(dir + _)
    //println(fileDirList)

    //2. 根据文件数量, 创建对应的WordCountActor对象.
    //2.1 先创建WordCountActor类, 用来获取WordCountActor对象.
    //2.2 根据文件数量, 创建对应的WordCountActor对象.
    val wordCountList = fileNameList.map(_ => new WordCountActor) //根据两个txt文件, 创建了两个wordCount对象.
    //println(wordCountList)
    //2.3 将WordCountActor和文件全路径关联起来
    val actorWithFile = wordCountList.zip(fileDirList) //WordCountActor -> ./data/1.txt ,  WordCountActor -> ./data/2.txt
    println(actorWithFile)

    //3. 启动WordCountActor, 并给每一个WordCountActor发送任务.
    /*
      Map(spark -> 1, hadoop -> 7, sqoop -> 1, flume -> 1)
      Map(sqoop -> 1, flink -> 1, hadoop -> 6, spark -> 1, hive -> 1)
     */
    val futureList: List[Future[Any]] = actorWithFile.map {       //futureList: 记录的是所有WordCountActor统计的结果.
      keyVal => //keyVal的格式: WordCountActor -> ./data/1.txt
        //3.1 获取具体的要启动的WordCountActor对象.
        val actor = keyVal._1 //actor: WordCountActor
        //3.2 启动具体的WordCountActor.
        actor.start()

        //3.3 给每个WordCountActor发送具体的任务(文件路径)  异步有返回.
        val future: Future[Any] = actor !! WordCountTask(keyVal._2)
        future      //记录的是某一个WordCountActor返回的统计结果.
    }

    //5. MainActor对接收到的数据进行合并.
    //5.1 判断所有的future都有返回值后, 再往下执行.
    //       过滤没有返回值的future         不为0说明还有future没有收到值
    while(futureList.filter(!_.isSet).size != 0) {} //futureList:  future1, future2
    //5.2 从每一个future中获取数据.
    //wordCountMap:  List(Map(spark -> 1, hadoop -> 7, sqoop -> 1, flume -> 1), Map(sqoop -> 1, flink -> 1, hadoop -> 6, spark -> 1, hive -> 1))
    val wordCountMap = futureList.map(_.apply().asInstanceOf[WordCountResult].wordCountMap)
    //5.3 对获取的数据进行flatten, groupBy, map, 然后统计.
    val result = wordCountMap.flatten.groupBy(_._1).map(keyVal => keyVal._1 -> keyVal._2.map(_._2).sum)
    //5.4 打印结果
    println(result)
  }
}

start()

      //3.3 给每个WordCountActor发送具体的任务(文件路径)  异步有返回.
      val future: Future[Any] = actor !! WordCountTask(keyVal._2)
      future      //记录的是某一个WordCountActor返回的统计结果.
  }

  //5. MainActor对接收到的数据进行合并.
  //5.1 判断所有的future都有返回值后, 再往下执行.
  //       过滤没有返回值的future         不为0说明还有future没有收到值
  while(futureList.filter(!_.isSet).size != 0) {} //futureList:  future1, future2
  //5.2 从每一个future中获取数据.
  //wordCountMap:  List(Map(spark -> 1, hadoop -> 7, sqoop -> 1, flume -> 1), Map(sqoop -> 1, flink -> 1, hadoop -> 6, spark -> 1, hive -> 1))
  val wordCountMap = futureList.map(_.apply().asInstanceOf[WordCountResult].wordCountMap)
  //5.3 对获取的数据进行flatten, groupBy, map, 然后统计.
  val result = wordCountMap.flatten.groupBy(_._1).map(keyVal => keyVal._1 -> keyVal._2.map(_._2).sum)
  //5.4 打印结果
  println(result)
}

}

本文链接：https://blog.csdn.net/qq_36382679/article/details/107576720

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

PowerShell学习基础篇（使用帮助）-程序员宅基地

文章浏览阅读3.2k次。PowerShell不仅仅是一门脚本语言，其实是一种运行命令行工具的命令行Shell。虽然PowerShell可以通过脚本实现很复杂的功能，但脚本仅是使用PowerShell的一种方式。PowerShell为Windows管理员提供自动化管理的工具，微软的多个产品组都采用了PowerShell，第三方生态系统扩展也是基于PowerShell，并且全球的社区专家与爱好者也都帮助PowerShell变得越来越好。_powershell

ResponseBodyAdvice的理解与应用-程序员宅基地

文章浏览阅读2.5w次，点赞6次，收藏31次。ResponseBodyAdvice接口类：/* * Copyright 2002-2017 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * you may not use this file except in compliance..._responsebodyadvice

盘点各大互联网公司2017中秋月饼设计，你最喜欢哪一个？_各公司月饼礼盒-程序员宅基地

文章浏览阅读991次。日常，普通人拼车拼房拼自己，各大公司拼员工拼技术拼实力。每逢佳节，普通人拼奖金拼福利拼假期，而各大公司拼的是独树一帜的创意。在一年一度的中秋佳节来临之际，月饼作为中秋节的福利的代表，当然是各大公司必不可少的礼品之一。然而如何设计富有公司文化色彩的月饼；顺带还能为公司品牌宣传一波；并引起求职小高潮。这就需要丰富的想象力和新颖的创新能力。_各公司月饼礼盒

区块链学习-以太坊学习简介-程序员宅基地

文章浏览阅读235次。想知道更多关于区块链技术知识，请百度【链客区块链技术问答社区】链客，有问必答！！区块链1.0时代：也就是比特币应用中的区块链技术，里面记录着自比特币诞生以来的所有比特币转账交易，相当于比特币网络的“数据库”。其实在区块链1.0时代，也就是比特币运用的区块链技术中已经包含了智能合约的概念，可以说智能合约的引入，使得区块链技术进化为..._学习以太坊区块链需要哪些知识

vuex4的基本使用（typescript）_actiontree-程序员宅基地

文章浏览阅读2.9k次，点赞8次，收藏21次。每天对自己多问几个为什么，总是有着想象不到的收获。一个菜鸟小白的成长之路（copyer）前言：这篇博客主要介绍了vuex4的基本使用，从创建一个store对象，然后再store内部的属性进行一一的解释（就是vuex的五大和核心：state， getters，mutations，actions, modules），解释主要从类型，参数等等方面的解释，还是比较的详细。内容有点长，可以收藏起来，慢慢看哟（嘻嘻）vuex介绍 Vuex 是一个专为 Vue.js 应用程序开._actiontree

vue 基础作用域插槽的使用_vue 插槽中内容数量-程序员宅基地

文章浏览阅读192次。vue 作用域插槽的使用 <div id="app"> <cpn></cpn> <cpn>  <template slot-scope="slot"> <!-- <span v-for="item in slot.data"_vue 插槽中内容数量

随便推点

链表题目整理(C语言实现)_c语言链表实验题目-程序员宅基地

文章浏览阅读1k次。%title 链表的各种题目整理(C语言实现)(Simple and Brief) 最后更新于Date:2012-11-04这里处理的全部是单链表:typedef struct node { char *data; struct node *next; } node_t;我们约定一个打印链表的函数:void list_display(node_c语言链表实验题目

论程序员是怎么易燃易爆炸的？被领导提bug之后......_error:could not find the object-程序员宅基地

文章浏览阅读227次。杀一个程序员不需要用枪，改三次需求就可以了！对于程序员来说、没老婆不悲催。悲催的是：没老婆、控制台还不停的提示你：Error:could not find the object假如生活欺骗了你，不要悲伤不要心急。《代码大全》会一直陪伴着你……程序员被提bug之后的反应：a.怎么可能；b.在我这是好的，不信你来看看；c.真是奇怪，刚刚还好好的；d.肯定是数据问题；e.你清下缓存试试；f.重启下电脑试试；g.你装的什么版本的类库(jdk)；h.这谁写的代码；_error:could not find the object

【Linux】如何关闭Linux防火墙_linux虚拟机怎么关闭防火墙-程序员宅基地

文章浏览阅读2.1w次，点赞6次，收藏59次。在访问linux时，如果linux防火墙是开启状态，则无法访问其提供的服务，为此，需要将Linux的防火墙关闭，命令如下：查看防火墙状态firewall -cmd --state关闭防火墙systemctl stop firewalld.service开启防火墙systemctl start firewalld.service禁止开机启动启动防火墙=systemctl disable firewalld.service建议自己学习使用的Linux虚拟机可以_linux虚拟机怎么关闭防火墙

MSSQL 索引-程序员宅基地

文章浏览阅读749次。一索引的分类1 聚集索引: 就是表中的主键，每个表中只能有一个聚集索引.2 非聚集索引: 根据查询条件的不同设置的索引二索引使用的场景索引一般建在经常使用的的列上，如用户登录时，经常会根据用户名查出，用户密码，这个时候一般在用户名字段上增加索引1 索引的创建的代码create nonclustered index index_username on user_mssql 索引

Qt for Android10 自动更新app，安装apk包_qt android 更新app安装-程序员宅基地

文章浏览阅读2.3k次，点赞5次，收藏9次。qml qt for android 安装apk app自动更新_qt android 更新app安装

html iis配置默认文档,IIS设置默认内容文档-程序员宅基地

文章浏览阅读3.9k次。浏览网站实际上是浏览网站中的网页文件。为了便于用户访问，每个站点一般都有自己的默认文档。一般情况下，默认文档都被设置为该网站的主页或某个索引页。默认文档的作用是简便用户的输入，使用户不必在浏览器中输入网站主页的文件名才能访问该网站。例如，网站www.Gench.com.cn将默认主页设置为index.htm，那么，用户在浏览器中输入www.Gench.com.cn时，IIS会自动将页面转换到默认文..._iis中【启用默认内容文档】选项中将默认打开文档修改为程序首页文件格式,如:index