贪心算法(三)——最佳合并模式

news/2024/9/18 10:49:37

问题描述

给定n个有序文件,每个文件的记录数分别为w1~wn,请给出一种两两合并的方案,使得总合并次数最少。

注意:
1. 外排序算法是将多个有序文件合并成一个有序文件的过程。
2. 在一次合并的过程中,两个文件中的所有记录都需要先从文件中读入内存,再在内存中排序,最后将排序的结果写入文件中。
3. 假设两个待排序文件记录数分别为n、m,那么将这两个文件合并成一个有序的文件需要进行n+m次读写。

问题转化

n个文件两两合并的过程可以用一棵扩充二叉树来表示。因为扩充二叉树只有度为2或0的节点,没有度为1的节点,这符合两两合并的过程。

在这棵扩充二叉树中:
1. 方形节点(外界点)表示原始的文件,圆形节点(内节点)表示合并过程中的文件;
2. 节点的权值表示文件的记录数
因此,n个文件合并过程的总读写次数为带权外路径长度之和。
要求最小的合并次数即为求最小的带权外路径长度之和。
因此,问题就转化为『如何求扩充二叉树的最小加权路径』。
这个问题可以用哈夫曼算法解决。

哈夫曼算法

思路

若要使得带权外路径长度最小,可以将权值大的节点尽量靠近根节点,这样路径短一些;而权值小的节点可以适当远离根节点,因为权值小,外路径稍微长一点也没事。

伪代码

  1. 用一个优先权队列存储所有的初始节点;
  2. 从队列中选出两个权值最小的节点,将它们的和作为它们的根节点,并放入队列中;
  3. 循环这个过程,直到队列中只有一个节点为止,此时具有最小带权路径的扩充二叉树构造完毕!此时带权外路径长度即为最小的读写次数。

代码实现

/**
 * 构造二叉树的节点类
 */
class TreeNode{
    int val;
    TreeNode left;
    TreeNode right;
    TreeNode(int val){
        this.val = val;
    }
}
  • 1
/**
 * 构造哈夫曼树
 * @param w:所有节点的权值
 * @return 哈夫曼树的根节点
 */
TreeNode hfmTree(int[] w){
    // 将所有节点存入优先权队列,按照权值递增排序
    PriorityQueue<TreeNode> queue = new PriorityQueue<>(w.length, new Comparator<TreeNode>(){
        public int compare(TreeNode t1,TreeNodet2){
            return t1.val-t2.val;
        }
    });
    for(int i=0; i<w.length; i++){
        queue.offer(new TreeNode(w[i]));
    }

    // 构造哈夫曼树
    while( queue.size()>1 ){
        // 弹出最小的两个节点
        TreeNode node1 = queue.poll();
        TreeNode node2 = queue.poll();
        // 构造父节点
        TreeNode father = new TreeNode(node1+node2);
        father.left = node1;
        father.right = node2;
        // 父节点入队
        queue.offer( father );
    }

    return queue.poll();
}

http://lihuaxi.xjx100.cn/news/295578.html

相关文章

数据采集的数据源有哪些?

从数据采集角度来说&#xff0c;都有哪些数据源呢&#xff1f; 这四类数据源包括了&#xff1a;开放数据源、爬虫抓取、传感器和日志采集 开放数据源一般是针对行业的数据库。国内&#xff0c;贵州做了不少大胆尝试&#xff0c;搭建了云平台&#xff0c;逐年开放了旅游、交通、…

Vue3类与样式绑定

官网&#xff1a;https://cn.vuejs.org/guide/essentials/class-and-style.html#binding-inline-styles 绑定 HTML class 绑定对象 const isActive ref(true) const hasError ref(false)<divclass"static":class"{ active: isActive, text-danger: hasEr…

数苹果-第12届蓝桥杯Scratch选拔赛真题精选

[导读]&#xff1a;超平老师计划推出Scratch蓝桥杯真题解析100讲&#xff0c;这是超平老师解读Scratch蓝桥真题系列的第91讲。 蓝桥杯选拔赛每一届都要举行4~5次&#xff0c;和省赛、国赛相比&#xff0c;题目要简单不少&#xff0c;再加上篇幅有限&#xff0c;因此我精挑细选…

(四) 共享模型之管程【Monitor 概念】

一、Java 对象头&#xff08;P75&#xff09; 二、原理之 Monitor(锁) Monitor 被翻译为监视器或管程。 每个 Java 对象都可以关联一个 Monitor 对象&#xff0c;如果使用 synchronized 给对象上锁&#xff08;重量级&#xff09;之后&#xff0c;该对象头的 Mark Word 中就被设…

Kotlin高仿微信-第27篇-朋友圈-相册选择图片或小视频

Kotlin高仿微信-项目实践58篇详细讲解了各个功能点&#xff0c;包括&#xff1a;注册、登录、主页、单聊(文本、表情、语音、图片、小视频、视频通话、语音通话、红包、转账)、群聊、个人信息、朋友圈、支付服务、扫一扫、搜索好友、添加好友、开通VIP等众多功能。 Kotlin高仿…

计算机毕业设计Java高校防疫物资管理系统(源码+系统+mysql数据库+lw文档)

计算机毕业设计Java高校防疫物资管理系统&#xff08;源码系统mysql数据库lw文档&#xff09; 计算机毕业设计Java高校防疫物资管理系统&#xff08;源码系统mysql数据库lw文档&#xff09;本源码技术栈&#xff1a; 项目架构&#xff1a;B/S架构 开发语言&#xff1a;Java语…

项目的坎坷一生

一、从产品到项目 项目的定义&#xff1a;只会进行一次&#xff0c;包含多项互相关联的任务&#xff0c;并且有绩效、时间、成本和范围限制的一项工作。 产品是解决某个问题的东西&#xff0c;项目是一个过程。 1、做产品VS做项目 ①从生命周期角度区别 做产品的生命周期相…

Stable Diffusion 关键词tag语法教程

Stable Diffusion 关键词tag语法教程 AI绘图在线体验 二次元绘图 在线体验地址:Stable Diffusion 模型包括&#xff1a; NovelAI&#xff0c;NovelAI的模型训练使用了数千个网站的数十亿张图片&#xff0c;包括 Pixiv、Twitter、DeviantArt、Tumblr等网站的作品。 Waifu&am…