百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Linux Ubuntu配置Python、C++下属GDAL环境的Docker镜像

nanshan 2024-11-02 12:17 12 浏览 0 评论

#精品长文创作季#

??本文介绍在LinuxUbuntu操作系统中,基于Docker快速配置PythonC++2种不同编程语言可用的地理数据处理库GDAL开发环境的方法。

??本文就将PythonC++2种不同编程语言的GDAL模块配置方法分开来介绍,大家依据自己的需求来选择即可——但无论是哪种方法,配置GDAL模块的方法都非常简单,终端中输入几句代码就完成了。和我们之前在Windows系统中配置GDAL模块的文章Visual Studio配置并编译C++环境下GDAL库、SQLite环境与PROJ库的方法(https://blog.csdn.net/zhebushibiaoshifu/article/details/127088090)比起来,真的是方便了很多。

1 Python版本

??首先,我们访问GDAL库的Docker镜像官方网站(https://github.com/OSGeo/gdal/tree/master/docker)。这里需要注意,虽然这个官方网站似乎并没有明确说明它提供的版本只能Python使用,但是我这里下载后发现C++代码确实无法调用这个镜像中的GDAL模块。

??其中,官方网站提供了AlpineUbuntu两种不同系统的Docker镜像;并且对于不同的系统版本,其还提供了SmallFull两种不同的镜像内容,其中前者包含的内容相对较少,而后者包含的内容较为齐全(因此后者的镜像大小也就更大一些),而这两种镜像自身都是包含Python3.8或以上版本的。此外,关于SmallFull两种不同镜像的具体详细内容差异,我们这里就不再赘述了,大家在其官方网站查阅即可;具体如下图所示。

??在我这里,由于只是需要用GDAL库完成一些读取.tif格式文件的操作,所以并不需要特别完整的GDAL库,所以就选择了Small这个小一点的版本。

??接下来,我们在Ubuntu电脑的终端中执行如下的代码。这里需要注意,由于我需要的是Ubuntu系统的Small版本,所以我就输入如下的代码即可;如果大家使用的是Alpine操作系统,或者是Ubuntu系统的Full版本,那么按照上图中自己所需要的版本对应的名称,修改下述代码并执行即可。

docker pull ghcr.io/osgeo/gdal:ubuntu-small-latest

??运行上述代码,如下图所示。

??稍等片刻,我们就完成了镜像的获取。此时,我们可以通过如下的代码,查看当前电脑中Docker镜像的下载情况(也就是看看我们已经有了哪些镜像)。

docker images

??运行上述代码,如下图所示。

??其中,那个ghcr.io/osgeo/gdal就是我们刚刚下载好的GDAL库的镜像。

??接下来,运行如下的代码,从而基于刚刚下载好的镜像运行一个容器。

docker run -it --rm ghcr.io/osgeo/gdal:ubuntu-small-latest

??其中,docker run是运行容器的命令,-it表示以交互模式运行容器,并分配一个终端,--rm表示在容器停止后自动删除容器(如果大家在使用容器后不想让它自动删除,就将这里的--rm去掉即可;如果大家是第一次接触Docker,那么建议带上这个--rm,防止自己摸索过程中不知不觉建立了好多个无用的容器,到时候还要手动一个一个删除);后面的就是我们刚刚下载好的镜像,表示我们要基于这个镜像去运行一个容器。运行上述代码,如下图所示。

??接下来,我们就进入了容器。此时,继续输入如下的代码,查看当前容器中GDAL库的版本信息。

gdalinfo --version

??运行上述代码,如下图所示。可以看到,此时将打印出我们GDAL库的版本信息。

??接下来,我们先通过如下的代码,退出当前镜像,回到终端中。

exit

??运行上述代码,如下图所示。

??我们既然配置了一个GDAL库的Docker镜像,那么后续肯定是需要将一些我们自己电脑中的文件(比如栅格图像、矢量数据等文件)带入到这个镜像的容器中去运行,所以肯定需要这个GDAL库的Docker镜像要和我们Ubuntu电脑中文件可以交互(换句话说,也就是可以读取、修改我们电脑中的文件与数据)。因此,我们在之后进入我们这个GDAL库的Docker镜像的容器时,需要通过如下的代码。

docker run -it --rm -v /home/dell/cppGDAL:/home/dell/cppGDAL ghcr.io/osgeo/gdal:ubuntu-small-latest

??上述代码和我们前面的docker run -it --rm ghcr.io/osgeo/gdal:ubuntu-small-latest相比,很显然是多了-v /home/dell/cppGDAL:/home/dell/cppGDAL这一个部分——这一部分是用于挂载主机文件系统中的目录容器中的命令参数。其中,-vDocker命令中用于挂载文件或目录的选项,其后面的/home/dell/cppGDAL:/home/dell/cppGDAL,则是文件挂载的源目录和目标目录的路径——它指定了主机文件系统中的/home/dell/cppGDAL目录将被挂载到容器内的/home/dell/cppGDAL目录。

??这里多提一句,我们这里是将主机中的一个指定文件路径挂载到了容器中,所以属于Docker中的Bind mounts;如果我们这里是手动创建了一个Volume,然后挂载到容器中,那么就叫做Volume;此外还有一种叫做tmpfs mounts,是把容器的数据写入主机的内存中——上述的Bind mountsVolumetmpfs mounts,这3种都是Docker用以数据管理、数据记忆的方式。

??回到前述的代码。换句话说,上述命令将我的Ubuntu电脑中的/home/dell/cppGDAL目录与GDAL库的Docker镜像的容器中的/home/dell/cppGDAL目录进行了挂载。这样,在容器中对挂载点/home/dell/cppGDAL的操作将反映在主机系统的/home/dell/cppGDAL目录上,反之亦然。

??相当于通过这种方式,只要我将我需要用GDAL库处理的数据、代码等文件,都放在电脑的/home/dell/cppGDAL目录下,那么就可以在容器中对这些数据加以访问和处理。这样即实现了文件的交互,同样可以保证容器不会访问我们电脑中其他文件夹内的数据或者文件,保证了数据的安全。

??如果大家还是没有明白这句代码的意义,不着急,我们先运行上述代码,如下图所示。

??上图中运行完代码,我又不小心多运行了一句pwd代码,大家理解即可。

??为了更清晰地看到前述那一种进入容器的代码的意义,我们做一个如下的对比。如下图所示,这是我们用了那一句包含挂载文件夹命令的代码,进入我们的容器后,执行的操作;可以看到,此时在容器中,我们就可以进入/home/dell/cppGDAL目录下。

??而如果我们并没有挂载文件,而是用了本文中第一次出现的那一句代码进入容器的代码,也就是前面的docker run -it --rm ghcr.io/osgeo/gdal:ubuntu-small-latest代码,进入容器后会发现,cd进入home文件夹后,再ls,是看不到我们这个cppGDAL文件夹的;换句话说,此时我们就没有办法在容器内部读取我们电脑里/home/dell/cppGDAL目录下的文件了——连文件、数据都无法获取,那么这个GDAL镜像肯定也是没有用处的了。

??此外,前面我们还提到,-v /home/dell/cppGDAL:/home/dell/cppGDAL这一个部分可以保证镜像可以且仅可以读取/home/dell/cppGDAL目录下的文件,而不会读取到我们没有挂载的其他文件夹。针对这一个内容,我们再做一个对比。如下图所示,是我们直接在Ubuntu电脑的终端中,进入/home/dell目录的情况;可以很明显地看到,在电脑中的/home/dell目录下,不仅有我们的这个cppGDAL文件夹,还有很多很多其他的文件或者文件夹;而在上上图中,可以看到在容器中,我们进入/home/dell/cppGDAL目录下只能看到这个cppGDAL文件夹,而看不到电脑中这一路径下原本还有的其他文件或者文件夹。所以很明显,相当于我们就是可以在镜像中访问/home/dell/cppGDAL目录,但是无法访问没有挂载的其他文件夹,从而保证了其他无关文件夹的安全性。

??明白了上述内容,就可以开始我们的GDAL操作了。例如,我这里在/home/dell/cppGDAL目录下还有一个名称为TIF的文件夹,其中保存了一景遥感影像,那么我就可以通过gdalinfo语句,查看这一栅格数据的信息。如下图所示。

??最后,每一次完成镜像中的操作后,不要忘记通过exit命令,退出镜像。

??因为我这里是需要C++版本的GDAL模块,所以后来也就没有对上述Python版本的再加以代码测试;但经过上述配置,运行Python代码的GDAL程序应该是没有问题了。

2 C++版本

??接下来,我们介绍配置C++版本的GDAL模块的方法。

??由于GDAL官方似乎并未提供直接的C++版本镜像,所以我们这里就自己创建一个Docker镜像,随后在其中配置GDAL模块。这里需要注意,如果大家刚刚根据前文的流程,先配置了一个Python语言的GDAL模块的镜像,那么建议大家在另一个新的镜像内重新配置C++版本的,不要直接在前面的Python语言镜像中配置GDAL模块——因为官网说,在前面这个Python语言的GDAL模块的镜像内配置其他版本的GDAL模块,会容易由于GDAL模块的版本冲突导致容器无法工作(虽然我当时简单尝试了一下,发现即使如此,容器似乎还是可以正常工作的)。

??我们这里就在一个新的Ubuntu镜像中加以配置。首先,在终端中输入如下代码,创建一个Ubuntu镜像。

docker pull ubuntu

??运行上述代码,如下图所示。

??接下来,我们用前文提到的这一句代码,运行一个容器。这里我就不再用--rm了,从而使得我们这个容器之后可以多次重复使用。

docker run -it -v /home/dell/cppGDAL:/home/cppGDAL ubuntu:latest

??运行上述代码,如下图所示。

??接下来,因为我们这个容器是基于一个空白的Ubuntu镜像创建的,很多执行GDALC++代码所需的配置都没有处理,我们需要配置一下基本的环境。

??首先,通过如下代码更新软件包列表

apt update

??运行上述代码,如下图所示。

??随后,输入如下的代码,配置GDAL模块的C++库。其中,libpq-devPostgreSQL数据库的开发库,包含了开发PostgreSQL应用程序所需的头文件和静态库;gdal-binGDAL的二进制工具包,提供了一些用于处理地理空间数据的工具,如转换、裁剪等;libgdal-devGDAL的开发库,包含了开发GDAL应用程序所需的头文件和静态库。

apt install libpq-dev gdal-bin libgdal-dev

??运行上述代码,如下图所示。

??稍等片刻,中间有一个环节需要我们根据自己所在位置加以选择,从而配置自己的时区;如下图所示。

??完成配置后,通过如下的代码查看GDAL库的版本。

gdalinfo --version

??运行上述代码,如下图所示。

??接下来,我们再按照文章Linux Ubuntu命令行快速配置C++开发环境(https://blog.csdn.net/zhebushibiaoshifu/article/details/133006231)介绍的方法,配置UbuntuC++代码开发环境,这里就不再赘述了。

??随后,我们就可以在Docker中执行一个简单的C++程序,来验证这个GDAL库的配置是否成功。其中,我们因为已经挂载了文件夹,所以既可以在主机中通过其他编辑器来撰写这个C++代码,也可以在容器中通过Vim来撰写。但无论怎么撰写,都要记得将这个代码文件(也就是.cpp格式的文件)放在已经挂载了的文件路径内。

??这个简单的C++代码如下;其含义就是,从我们已经挂载了的主机的一个文件夹中,读取一景栅格影像,获取并打印其像元的行数与列数。

#include <iostream>
#include <gdal/gdal.h>
#include <gdal/gdal_priv.h>
using namespace std;

int main() {
    const char* image_path = "/home/cppGDAL/TIF/LAI_A2000057_h30v05.tif";
    GDALAllRegister();
    GDALDataset* dataset = (GDALDataset*)GDALOpen(image_path, GA_ReadOnly);
    if (dataset != nullptr)
    {
        int rows = dataset->GetRasterYSize();
        int cols = dataset->GetRasterXSize();

        printf("Rows: %d\n", rows);
        printf("Cols: %d\n", cols);

        GDALClose(dataset);
    }
    return 0;
}

??随后,在容器内的上述代码文件目录下,执行如下的代码。

g++ `gdal-config --cflags` rec.cpp  `gdal-config --libs` `gdal-config --dep-libs` -o test

??其中,g++GNU C++编译器的命令,用于编译和链接C++代码。gdal-config --cflags表示使用gdal-config命令获取GDAL库的编译选项,包括头文件路径和其他必要的编译标志;--cflags参数告诉gdal-config命令返回编译选项。rec.cpp是要编译的C++源文件的文件名,也就是前面我们写的代码文件的文件名称。需要注意的是,上述代码中没有单引号,而都是反引号,大家输入的时候不要输错了。

??其次,gdal-config --libs使用gdal-config命令来获取GDAL库的链接选项,包括库文件路径和其他必要的链接标志;--libs参数告诉gdal-config命令返回链接选项。gdal-config --dep-libs使gdal-config命令来获取GDAL库所依赖的其他库的链接选项;--dep-libs参数告诉gdal-config命令返回依赖库的链接选项。

??最后,-o test是编译器选项,用于指定生成的可执行文件的名称为test-o选项后跟着要生成的可执行文件的名称。

??完成上述步骤,在当前目录下就会有一个可执行文件,名称为test。我们执行如下的代码,就可以执行这个可执行文件

./test

??运行上述代码,如下图所示。

??可以看到,已经可以打印出这一景遥感影像的像元行数与列数了。

??至此,大功告成。

欢迎关注:疯狂学习GIS

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: