/** * This file is part of ORB-SLAM3 * * Copyright (C) 2017-2020 Carlos Campos, Richard Elvira, Juan J. Gómez Rodríguez, José M.M. Montiel and Juan D. Tardós, University of Zaragoza. * Copyright (C) 2014-2016 Raúl Mur-Artal, José M.M. Montiel and Juan D. Tardós, University of Zaragoza. * * ORB-SLAM3 is free software: you can redistribute it and/or modify it under the terms of the GNU General Public * License as published by the Free Software Foundation, either version 3 of the License, or * (at your option) any later version. * * ORB-SLAM3 is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even * the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * GNU General Public License for more details. * * You should have received a copy of the GNU General Public License along with ORB-SLAM3. * If not, see . */ #include "Initializer.h" #include "Thirdparty/DBoW2/DUtils/Random.h" #include "Optimizer.h" #include "ORBmatcher.h" #include #include namespace ORB_SLAM3 { /** * @brief 根据参考帧构造初始化器 * * @param[in] ReferenceFrame 参考帧 * @param[in] sigma 测量误差 * @param[in] iterations RANSAC迭代次数 */ Initializer::Initializer(const Frame &ReferenceFrame, float sigma, int iterations) { mpCamera = ReferenceFrame.mpCamera; //从参考帧中获取相机的内参数矩阵 mK = ReferenceFrame.mK.clone(); // 从参考帧中获取去畸变后的特征点 mvKeys1 = ReferenceFrame.mvKeysUn; mSigma = sigma; mSigma2 = sigma*sigma; //最大迭代次数 mMaxIterations = iterations; } /** * @brief 计算基础矩阵和单应性矩阵,选取最佳的来恢复出最开始两帧之间的相对姿态,并进行三角化得到初始地图点 * Step 1 重新记录特征点对的匹配关系 * Step 2 在所有匹配特征点对中随机选择8对匹配特征点为一组,用于估计H矩阵和F矩阵 * Step 3 计算fundamental 矩阵 和homography 矩阵,为了加速分别开了线程计算 * Step 4 计算得分比例来判断选取哪个模型来求位姿R,t * * @param[in] CurrentFrame 当前帧,也就是SLAM意义上的第二帧 * @param[in] vMatches12 当前帧(2)和参考帧(1)图像中特征点的匹配关系 * vMatches12[i]解释:i表示帧1中关键点的索引值,vMatches12[i]的值为帧2的关键点索引值 * 没有匹配关系的话,vMatches12[i]值为 -1 * @param[in & out] R21 相机从参考帧到当前帧的旋转 * @param[in & out] t21 相机从参考帧到当前帧的平移 * @param[in & out] vP3D 三角化测量之后的三维地图点 * @param[in & out] vbTriangulated 标记三角化点是否有效,有效为true * @return true 该帧可以成功初始化,返回true * @return false 该帧不满足初始化条件,返回false */ bool Initializer::Initialize(const Frame &CurrentFrame, const vector &vMatches12, cv::Mat &R21, cv::Mat &t21, vector &vP3D, vector &vbTriangulated) { // Reference Frame: 1, Current Frame: 2 //获取当前帧的去畸变之后的特征点 mvKeys2 = CurrentFrame.mvKeysUn; // mvMatches12记录匹配上的特征点对,记录的是帧2在帧1的匹配索引 mvMatches12.clear(); // 预分配空间,大小和关键点数目一致mvKeys2.size() mvMatches12.reserve(mvKeys2.size()); // 记录参考帧1中的每个特征点是否有匹配的特征点 // 这个成员变量后面没有用到,后面只关心匹配上的特征点 mvbMatched1.resize(mvKeys1.size()); // Step 1 重新记录特征点对的匹配关系存储在mvMatches12,是否有匹配存储在mvbMatched1 // 将vMatches12(有冗余) 转化为 mvMatches12(只记录了匹配关系) for(size_t i=0, iend=vMatches12.size();i=0) { //mvMatches12 中只记录有匹配关系的特征点对的索引值 //i表示帧1中关键点的索引值,vMatches12[i]的值为帧2的关键点索引值 mvMatches12.push_back(make_pair(i,vMatches12[i])); //标记参考帧1中的这个特征点有匹配关系 mvbMatched1[i]=true; } else //标记参考帧1中的这个特征点没有匹配关系 mvbMatched1[i]=false; } // 有匹配的特征点的对数 const int N = mvMatches12.size(); // Indices for minimum set selection // 新建一个容器vAllIndices存储特征点索引,并预分配空间 vector vAllIndices; vAllIndices.reserve(N); //在RANSAC的某次迭代中,还可以被抽取来作为数据样本的特征点对的索引,所以这里起的名字叫做可用的索引 vector vAvailableIndices; //初始化所有特征点对的索引,索引值0到N-1 for(int i=0; i >(mMaxIterations,vector(8,0)); //用于进行随机数据样本采样,设置随机数种子 DUtils::Random::SeedRandOnce(0); //开始每一次的迭代 for(int it=0; it vbMatchesInliersH, vbMatchesInliersF; //计算出来的单应矩阵和基础矩阵的RANSAC评分,这里其实是采用重投影误差来计算的 float SH, SF; //这两个是经过RANSAC算法后计算出来的单应矩阵和基础矩阵 cv::Mat H, F; // 构造线程来计算H矩阵及其得分 // thread方法比较特殊,在传递引用的时候,外层需要用ref来进行引用传递,否则就是浅拷贝 thread threadH(&Initializer::FindHomography, //该线程的主函数 this, //由于主函数为类的成员函数,所以第一个参数就应该是当前对象的this指针 ref(vbMatchesInliersH), //输出,特征点对的Inlier标记 ref(SH), //输出,计算的单应矩阵的RANSAC评分 ref(H)); //输出,计算的单应矩阵结果 // 计算fundamental matrix并打分,参数定义和H是一样的,这里不再赘述 thread threadF(&Initializer::FindFundamental,this,ref(vbMatchesInliersF), ref(SF), ref(F)); //cout << "5" << endl; // Wait until both threads have finished //等待两个计算线程结束 threadH.join(); threadF.join(); // Compute ratio of scores // Step 4 计算得分比例来判断选取哪个模型来求位姿R,t //通过这个规则来判断谁的评分占比更多一些,注意不是简单的比较绝对评分大小,而是看评分的占比 float RH = SH/(SH+SF); //cout << "6" << endl; float minParallax = 1.0; // 1.0 originally cv::Mat K = static_cast(mpCamera)->toK(); // Try to reconstruct from homography or fundamental depending on the ratio (0.40-0.45) // 注意这里更倾向于用H矩阵恢复位姿。如果单应矩阵的评分占比达到了0.4以上,则从单应矩阵恢复运动,否则从基础矩阵恢复运动 if(RH>0.40) // if(RH>0.40) { //更偏向于平面,此时从单应矩阵恢复,函数ReconstructH返回bool型结果 return ReconstructH(vbMatchesInliersH, //输入,匹配成功的特征点对Inliers标记 H, //输入,前面RANSAC计算后的单应矩阵 K, //输入,相机的内参数矩阵 R21,t21, //输出,计算出来的相机从参考帧1到当前帧2所发生的旋转和位移变换 vP3D, //特征点对经过三角测量之后的空间坐标,也就是地图点 vbTriangulated, //特征点对是否成功三角化的标记 minParallax, //这个对应的形参为minParallax,即认为某对特征点的三角化测量中,认为其测量有效时 //需要满足的最小视差角(如果视差角过小则会引起非常大的观测误差),单位是角度 50); //为了进行运动恢复,所需要的最少的三角化测量成功的点个数 } else //if(pF_HF>0.6) { // 更偏向于非平面,从基础矩阵恢复 //cout << "Initialization from Fundamental" << endl; return ReconstructF(vbMatchesInliersF,F,K,R21,t21,vP3D,vbTriangulated,minParallax,50); } //一般地程序不应该执行到这里,如果执行到这里说明程序跑飞了 return false; } /** * @brief 计算单应矩阵,假设场景为平面情况下通过前两帧求取Homography矩阵,并得到该模型的评分 * 原理参考Multiple view geometry in computer vision P109 算法4.4 * Step 1 将当前帧和参考帧中的特征点坐标进行归一化 * Step 2 选择8个归一化之后的点对进行迭代 * Step 3 八点法计算单应矩阵矩阵 * Step 4 利用重投影误差为当次RANSAC的结果评分 * Step 5 更新具有最优评分的单应矩阵计算结果,并且保存所对应的特征点对的内点标记 * * @param[in & out] vbMatchesInliers 标记是否是外点 * @param[in & out] score 计算单应矩阵的得分 * @param[in & out] H21 单应矩阵结果 */ void Initializer::FindHomography(vector &vbMatchesInliers, float &score, cv::Mat &H21) { // Number of putative matches //匹配的特征点对总数 const int N = mvMatches12.size(); // Normalize coordinates // Step 1 将当前帧和参考帧中的特征点坐标进行归一化,主要是平移和尺度变换 // 具体来说,就是将mvKeys1和mvKey2归一化到均值为0,一阶绝对矩为1,归一化矩阵分别为T1、T2 // 这里所谓的一阶绝对矩其实就是随机变量到取值的中心的绝对值的平均值 // 归一化矩阵就是把上述归一化的操作用矩阵来表示。这样特征点坐标乘归一化矩阵可以得到归一化后的坐标 //归一化后的参考帧1和当前帧2中的特征点坐标 vector vPn1, vPn2; // 记录各自的归一化矩阵 cv::Mat T1, T2; Normalize(mvKeys1,vPn1, T1); Normalize(mvKeys2,vPn2, T2); //这里求的逆在后面的代码中要用到,辅助进行原始尺度的恢复 cv::Mat T2inv = T2.inv(); // Best Results variables // 记录最佳评分 score = 0.0; // 取得历史最佳评分时,特征点对的inliers标记 vbMatchesInliers = vector(N,false); // Iteration variables //某次迭代中,参考帧的特征点坐标 vector vPn1i(8); //某次迭代中,当前帧的特征点坐标 vector vPn2i(8); //以及计算出来的单应矩阵、及其逆矩阵 cv::Mat H21i, H12i; // 每次RANSAC记录Inliers与得分 vector vbCurrentInliers(N,false); float currentScore; // Perform all RANSAC iterations and save the solution with highest score //下面进行每次的RANSAC迭代 for(int it=0; itscore) { //如果当前的结果得分更高,那么就更新最优计算结果 H21 = H21i.clone(); //保存匹配好的特征点对的Inliers标记 vbMatchesInliers = vbCurrentInliers; //更新历史最优评分 score = currentScore; } } } /** * @brief 计算基础矩阵,假设场景为非平面情况下通过前两帧求取Fundamental矩阵,得到该模型的评分 * Step 1 将当前帧和参考帧中的特征点坐标进行归一化 * Step 2 选择8个归一化之后的点对进行迭代 * Step 3 八点法计算基础矩阵矩阵 * Step 4 利用重投影误差为当次RANSAC的结果评分 * Step 5 更新具有最优评分的基础矩阵计算结果,并且保存所对应的特征点对的内点标记 * * @param[in & out] vbMatchesInliers 标记是否是外点 * @param[in & out] score 计算基础矩阵得分 * @param[in & out] F21 从特征点1到2的基础矩阵 */ void Initializer::FindFundamental(vector &vbMatchesInliers, float &score, cv::Mat &F21) { // 计算基础矩阵,其过程和上面的计算单应矩阵的过程十分相似. // Number of putative matches // 匹配的特征点对总数 const int N = vbMatchesInliers.size(); // Normalize coordinates // Step 1 将当前帧和参考帧中的特征点坐标进行归一化,主要是平移和尺度变换 // 具体来说,就是将mvKeys1和mvKey2归一化到均值为0,一阶绝对矩为1,归一化矩阵分别为T1、T2 // 这里所谓的一阶绝对矩其实就是随机变量到取值的中心的绝对值的平均值 // 归一化矩阵就是把上述归一化的操作用矩阵来表示。这样特征点坐标乘归一化矩阵可以得到归一化后的坐标 vector vPn1, vPn2; cv::Mat T1, T2; Normalize(mvKeys1,vPn1, T1); Normalize(mvKeys2,vPn2, T2); // ! 注意这里取的是归一化矩阵T2的转置,因为基础矩阵的定义和单应矩阵不同,两者去归一化的计算也不相同 cv::Mat T2t = T2.t(); // Best Results variables //最优结果 score = 0.0; vbMatchesInliers = vector(N,false); // Iteration variables // 某次迭代中,参考帧的特征点坐标 vector vPn1i(8); // 某次迭代中,当前帧的特征点坐标 vector vPn2i(8); // 某次迭代中,计算的基础矩阵 cv::Mat F21i; // 每次RANSAC记录的Inliers与得分 vector vbCurrentInliers(N,false); float currentScore; // Perform all RANSAC iterations and save the solution with highest score // 下面进行每次的RANSAC迭代 for(int it=0; itscore) { //如果当前的结果得分更高,那么就更新最优计算结果 F21 = F21i.clone(); vbMatchesInliers = vbCurrentInliers; score = currentScore; } } } /** * @brief 用DLT方法求解单应矩阵H * 这里最少用4对点就能够求出来,不过这里为了统一还是使用了8对点求最小二乘解 * * @param[in] vP1 参考帧中归一化后的特征点 * @param[in] vP2 当前帧中归一化后的特征点 * @return cv::Mat 计算的单应矩阵H */ cv::Mat Initializer::ComputeH21( const vector &vP1, //归一化后的点, in reference frame const vector &vP2) //归一化后的点, in current frame { // 基本原理:见附件推导过程: // |x'| | h1 h2 h3 ||x| // |y'| = a | h4 h5 h6 ||y| 简写: x' = a H x, a为一个尺度因子 // |1 | | h7 h8 h9 ||1| // 使用DLT(direct linear tranform)求解该模型 // x' = a H x // ---> (x') 叉乘 (H x) = 0 (因为方向相同) (取前两行就可以推导出下面的了) // ---> Ah = 0 // A = | 0 0 0 -x -y -1 xy' yy' y'| h = | h1 h2 h3 h4 h5 h6 h7 h8 h9 | // |-x -y -1 0 0 0 xx' yx' x'| // 通过SVD求解Ah = 0,A^T*A最小特征值对应的特征向量即为解 // 其实也就是右奇异值矩阵的最后一列 //获取参与计算的特征点的数目 const int N = vP1.size(); // 构造用于计算的矩阵 A cv::Mat A(2*N, //行,注意每一个点的数据对应两行 9, //列 CV_32F); //float数据类型 // 构造矩阵A,将每个特征点添加到矩阵A中的元素 for(int i=0; i(2*i,0) = 0.0; A.at(2*i,1) = 0.0; A.at(2*i,2) = 0.0; A.at(2*i,3) = -u1; A.at(2*i,4) = -v1; A.at(2*i,5) = -1; A.at(2*i,6) = v2*u1; A.at(2*i,7) = v2*v1; A.at(2*i,8) = v2; //生成这个点的第二行 A.at(2*i+1,0) = u1; A.at(2*i+1,1) = v1; A.at(2*i+1,2) = 1; A.at(2*i+1,3) = 0.0; A.at(2*i+1,4) = 0.0; A.at(2*i+1,5) = 0.0; A.at(2*i+1,6) = -u2*u1; A.at(2*i+1,7) = -u2*v1; A.at(2*i+1,8) = -u2; } // 定义输出变量,u是左边的正交矩阵U, w为奇异矩阵,vt中的t表示是右正交矩阵V的转置 cv::Mat u,w,vt; //使用opencv提供的进行奇异值分解的函数 cv::SVDecomp(A, //输入,待进行奇异值分解的矩阵 w, //输出,奇异值矩阵 u, //输出,矩阵U vt, //输出,矩阵V^T cv::SVD::MODIFY_A | //输入,MODIFY_A是指允许计算函数可以修改待分解的矩阵,官方文档上说这样可以加快计算速度、节省内存 cv::SVD::FULL_UV); //FULL_UV=把U和VT补充成单位正交方阵 // 返回最小奇异值所对应的右奇异向量 // 注意前面说的是右奇异值矩阵的最后一列,但是在这里因为是vt,转置后了,所以是行;由于A有9列数据,故最后一列的下标为8 return vt.row(8).reshape(0, //转换后的通道数,这里设置为0表示是与前面相同 3); //转换后的行数,对应V的最后一列 } /** * @brief 根据特征点匹配求fundamental matrix(normalized 8点法) * 注意F矩阵有秩为2的约束,所以需要两次SVD分解 * * @param[in] vP1 参考帧中归一化后的特征点 * @param[in] vP2 当前帧中归一化后的特征点 * @return cv::Mat 最后计算得到的基础矩阵F */ cv::Mat Initializer::ComputeF21( const vector &vP1, //归一化后的点, in reference frame const vector &vP2) //归一化后的点, in current frame { // 原理详见附件推导 // x'Fx = 0 整理可得:Af = 0 // A = | x'x x'y x' y'x y'y y' x y 1 |, f = | f1 f2 f3 f4 f5 f6 f7 f8 f9 | // 通过SVD求解Af = 0,A'A最小特征值对应的特征向量即为解 //获取参与计算的特征点对数 const int N = vP1.size(); //初始化A矩阵 cv::Mat A(N,9,CV_32F); // N*9维 // 构造矩阵A,将每个特征点添加到矩阵A中的元素 for(int i=0; i(i,0) = u2*u1; A.at(i,1) = u2*v1; A.at(i,2) = u2; A.at(i,3) = v2*u1; A.at(i,4) = v2*v1; A.at(i,5) = v2; A.at(i,6) = u1; A.at(i,7) = v1; A.at(i,8) = 1; } //存储奇异值分解结果的变量 cv::Mat u,w,vt; // 定义输出变量,u是左边的正交矩阵U, w为奇异矩阵,vt中的t表示是右正交矩阵V的转置 cv::SVDecomp(A,w,u,vt,cv::SVD::MODIFY_A | cv::SVD::FULL_UV); // 转换成基础矩阵的形式 cv::Mat Fpre = vt.row(8).reshape(0, 3); // v的最后一列 //基础矩阵的秩为2,而我们不敢保证计算得到的这个结果的秩为2,所以需要通过第二次奇异值分解,来强制使其秩为2 // 对初步得来的基础矩阵进行第2次奇异值分解 cv::SVDecomp(Fpre,w,u,vt,cv::SVD::MODIFY_A | cv::SVD::FULL_UV); // 秩2约束,强制将第3个奇异值设置为0 w.at(2)=0; // 重新组合好满足秩约束的基础矩阵,作为最终计算结果返回 return u*cv::Mat::diag(w)*vt; } /** * @brief 对给定的homography matrix打分,需要使用到卡方检验的知识 * * @param[in] H21 从参考帧到当前帧的单应矩阵 * @param[in] H12 从当前帧到参考帧的单应矩阵 * @param[in] vbMatchesInliers 匹配好的特征点对的Inliers标记 * @param[in] sigma 方差,默认为1 * @return float 返回得分 */ float Initializer::CheckHomography( const cv::Mat &H21, //从参考帧到当前帧的单应矩阵 const cv::Mat &H12, //从当前帧到参考帧的单应矩阵 vector &vbMatchesInliers, //匹配好的特征点对的Inliers标记 float sigma) //估计误差 { // 说明:在已值n维观测数据误差服从N(0,sigma)的高斯分布时 // 其误差加权最小二乘结果为 sum_error = SUM(e(i)^T * Q^(-1) * e(i)) // 其中:e(i) = [e_x,e_y,...]^T, Q维观测数据协方差矩阵,即sigma * sigma组成的协方差矩阵 // 误差加权最小二次结果越小,说明观测数据精度越高 // 那么,score = SUM((th - e(i)^T * Q^(-1) * e(i)))的分数就越高 // 算法目标: 检查单应变换矩阵 // 检查方式:通过H矩阵,进行参考帧和当前帧之间的双向投影,并计算起加权最小二乘投影误差 // 算法流程 // input: 单应性矩阵 H21, H12, 匹配点集 mvKeys1 // do: // for p1(i), p2(i) in mvKeys: // error_i1 = ||p2(i) - H21 * p1(i)||2 // error_i2 = ||p1(i) - H12 * p2(i)||2 // // w1 = 1 / sigma / sigma // w2 = 1 / sigma / sigma // // if error1 < th // score += th - error_i1 * w1 // if error2 < th // score += th - error_i2 * w2 // // if error_1i > th or error_2i > th // p1(i), p2(i) are inner points // vbMatchesInliers(i) = true // else // p1(i), p2(i) are outliers // vbMatchesInliers(i) = false // end // end // output: score, inliers // 特点匹配个数 const int N = mvMatches12.size(); const float h11 = H21.at(0,0); const float h12 = H21.at(0,1); const float h13 = H21.at(0,2); const float h21 = H21.at(1,0); const float h22 = H21.at(1,1); const float h23 = H21.at(1,2); const float h31 = H21.at(2,0); const float h32 = H21.at(2,1); const float h33 = H21.at(2,2); // 获取从当前帧到参考帧的单应矩阵的各个元素 const float h11inv = H12.at(0,0); const float h12inv = H12.at(0,1); const float h13inv = H12.at(0,2); const float h21inv = H12.at(1,0); const float h22inv = H12.at(1,1); const float h23inv = H12.at(1,2); const float h31inv = H12.at(2,0); const float h32inv = H12.at(2,1); const float h33inv = H12.at(2,2); // 给特征点对的Inliers标记预分配空间 vbMatchesInliers.resize(N); // 初始化score值 float score = 0; // 基于卡方检验计算出的阈值(假设测量有一个像素的偏差) // 自由度为2的卡方分布,显著性水平为0.05,对应的临界阈值 const float th = 5.991; //信息矩阵,方差平方的倒数 const float invSigmaSquare = 1.0/(sigma*sigma); // Step 2 通过H矩阵,进行参考帧和当前帧之间的双向投影,并计算起加权最小二乘投影误差 // H21 表示从img1 到 img2的变换矩阵 // H12 表示从img2 到 img1的变换矩阵 for(int i=0; ith) bIn = false; else // 误差越大,得分越低 score += th - chiSquare1; // 计算从img1 到 img2 的投影变换误差 // x1in2 = H21*x1 // 将图像2中的特征点单应到图像1中 // |u2| |h11 h12 h13||u1| |u1in2| // |v2| = |h21 h22 h23||v1| = |v1in2| * w1in2inv // |1 | |h31 h32 h33||1 | | 1 | // 计算投影归一化坐标 const float w1in2inv = 1.0/(h31*u1+h32*v1+h33); const float u1in2 = (h11*u1+h12*v1+h13)*w1in2inv; const float v1in2 = (h21*u1+h22*v1+h23)*w1in2inv; // 计算重投影误差 const float squareDist2 = (u2-u1in2)*(u2-u1in2)+(v2-v1in2)*(v2-v1in2); const float chiSquare2 = squareDist2*invSigmaSquare; // 用阈值标记离群点,内点的话累加得分 if(chiSquare2>th) bIn = false; else score += th - chiSquare2; // Step 2.4 如果从img2 到 img1 和 从img1 到img2的重投影误差均满足要求,则说明是Inlier point if(bIn) vbMatchesInliers[i]=true; else vbMatchesInliers[i]=false; } return score; } /** * @brief 对给定的Fundamental matrix打分 * * @param[in] F21 当前帧和参考帧之间的基础矩阵 * @param[in] vbMatchesInliers 匹配的特征点对属于inliers的标记 * @param[in] sigma 方差,默认为1 * @return float 返回得分 */ float Initializer::CheckFundamental( const cv::Mat &F21, //当前帧和参考帧之间的基础矩阵 vector &vbMatchesInliers, //匹配的特征点对属于inliers的标记 float sigma) //方差 { // 说明:在已值n维观测数据误差服从N(0,sigma)的高斯分布时 // 其误差加权最小二乘结果为 sum_error = SUM(e(i)^T * Q^(-1) * e(i)) // 其中:e(i) = [e_x,e_y,...]^T, Q维观测数据协方差矩阵,即sigma * sigma组成的协方差矩阵 // 误差加权最小二次结果越小,说明观测数据精度越高 // 那么,score = SUM((th - e(i)^T * Q^(-1) * e(i)))的分数就越高 // 算法目标:检查基础矩阵 // 检查方式:利用对极几何原理 p2^T * F * p1 = 0 // 假设:三维空间中的点 P 在 img1 和 img2 两图像上的投影分别为 p1 和 p2(两个为同名点) // 则:p2 一定存在于极线 l2 上,即 p2*l2 = 0. 而l2 = F*p1 = (a, b, c)^T // 所以,这里的误差项 e 为 p2 到 极线 l2 的距离,如果在直线上,则 e = 0 // 根据点到直线的距离公式:d = (ax + by + c) / sqrt(a * a + b * b) // 所以,e = (a * p2.x + b * p2.y + c) / sqrt(a * a + b * b) // 算法流程 // input: 基础矩阵 F 左右视图匹配点集 mvKeys1 // do: // for p1(i), p2(i) in mvKeys: // l2 = F * p1(i) // l1 = p2(i) * F // error_i1 = dist_point_to_line(x2,l2) // error_i2 = dist_point_to_line(x1,l1) // // w1 = 1 / sigma / sigma // w2 = 1 / sigma / sigma // // if error1 < th // score += thScore - error_i1 * w1 // if error2 < th // score += thScore - error_i2 * w2 // // if error_1i > th or error_2i > th // p1(i), p2(i) are inner points // vbMatchesInliers(i) = true // else // p1(i), p2(i) are outliers // vbMatchesInliers(i) = false // end // end // output: score, inliers // 获取匹配的特征点对的总对数 const int N = mvMatches12.size(); // Step 1 提取基础矩阵中的元素数据 const float f11 = F21.at(0,0); const float f12 = F21.at(0,1); const float f13 = F21.at(0,2); const float f21 = F21.at(1,0); const float f22 = F21.at(1,1); const float f23 = F21.at(1,2); const float f31 = F21.at(2,0); const float f32 = F21.at(2,1); const float f33 = F21.at(2,2); // 预分配空间 vbMatchesInliers.resize(N); // 设置评分初始值(因为后面需要进行这个数值的累计) float score = 0; // 基于卡方检验计算出的阈值 // 自由度为1的卡方分布,显著性水平为0.05,对应的临界阈值 // ?是因为点到直线距离是一个自由度吗? const float th = 3.841; // 自由度为2的卡方分布,显著性水平为0.05,对应的临界阈值 const float thScore = 5.991; // 信息矩阵,或 协方差矩阵的逆矩阵 const float invSigmaSquare = 1.0/(sigma*sigma); // Step 2 计算img1 和 img2 在估计 F 时的score值 for(int i=0; ith) bIn = false; else // 误差越大,得分越低 score += thScore - chiSquare1; // 计算img2上的点在 img1 上投影得到的极线 l1= p2 * F21 = (a1,b1,c1) const float a1 = f11*u2+f21*v2+f31; const float b1 = f12*u2+f22*v2+f32; const float c1 = f13*u2+f23*v2+f33; // 计算误差 e = (a * p2.x + b * p2.y + c) / sqrt(a * a + b * b) const float num1 = a1*u1+b1*v1+c1; const float squareDist2 = num1*num1/(a1*a1+b1*b1); // 带权重误差 const float chiSquare2 = squareDist2*invSigmaSquare; // 误差大于阈值就说明这个点是Outlier if(chiSquare2>th) bIn = false; else score += thScore - chiSquare2; // Step 2.5 保存结果 if(bIn) vbMatchesInliers[i]=true; else vbMatchesInliers[i]=false; } // 返回评分 return score; } /** * @brief 从基础矩阵F中求解位姿R,t及三维点 * F分解出E,E有四组解,选择计算的有效三维点(在摄像头前方、投影误差小于阈值、视差角大于阈值)最多的作为最优的解 * @param[in] vbMatchesInliers 匹配好的特征点对的Inliers标记 * @param[in] F21 从参考帧到当前帧的基础矩阵 * @param[in] K 相机的内参数矩阵 * @param[in & out] R21 计算好的相机从参考帧到当前帧的旋转 * @param[in & out] t21 计算好的相机从参考帧到当前帧的平移 * @param[in & out] vP3D 三角化测量之后的特征点的空间坐标 * @param[in & out] vbTriangulated 特征点三角化成功的标志 * @param[in] minParallax 认为三角化有效的最小视差角 * @param[in] minTriangulated 最小三角化点数量 * @return true 成功初始化 * @return false 初始化失败 */ bool Initializer::ReconstructF(vector &vbMatchesInliers, cv::Mat &F21, cv::Mat &K, cv::Mat &R21, cv::Mat &t21, vector &vP3D, vector &vbTriangulated, float minParallax, int minTriangulated) { // Step 1 统计有效匹配点个数,并用 N 表示 // vbMatchesInliers 中存储匹配点对是否是有效 int N=0; for(size_t i=0, iend = vbMatchesInliers.size() ; i vP3D1, vP3D2, vP3D3, vP3D4; // 定义四组解分别对同一匹配点集的有效三角化结果,True or False vector vbTriangulated1,vbTriangulated2,vbTriangulated3, vbTriangulated4; // 定义四种解对应的比较大的特征点对视差角 float parallax1,parallax2, parallax3, parallax4; // Step 4.1 使用同样的匹配点分别检查四组解,记录当前计算的3D点在摄像头前方且投影误差小于阈值的个数,记为有效3D点个数 int nGood1 = CheckRT(R1,t1, //当前组解 mvKeys1,mvKeys2, //参考帧和当前帧中的特征点 mvMatches12, vbMatchesInliers, //特征点的匹配关系和Inliers标记 K, //相机的内参数矩阵 vP3D1, //存储三角化以后特征点的空间坐标 4.0*mSigma2, //三角化测量过程中允许的最大重投影误差 vbTriangulated1, //参考帧中被成功进行三角化测量的特征点的标记 parallax1); //认为某对特征点三角化测量有效的比较大的视差角 int nGood2 = CheckRT(R2,t1,mvKeys1,mvKeys2,mvMatches12,vbMatchesInliers,K, vP3D2, 4.0*mSigma2, vbTriangulated2, parallax2); int nGood3 = CheckRT(R1,t2,mvKeys1,mvKeys2,mvMatches12,vbMatchesInliers,K, vP3D3, 4.0*mSigma2, vbTriangulated3, parallax3); int nGood4 = CheckRT(R2,t2,mvKeys1,mvKeys2,mvMatches12,vbMatchesInliers,K, vP3D4, 4.0*mSigma2, vbTriangulated4, parallax4); // Step 4.2 选取最大可三角化测量的点的数目 int maxGood = max(nGood1,max(nGood2,max(nGood3,nGood4))); // 重置变量,并在后面赋值为最佳R和T R21 = cv::Mat(); t21 = cv::Mat(); // Step 4.3 确定最小的可以三角化的点数 // 在0.9倍的内点数 和 指定值minTriangulated =50 中取最大的,也就是说至少50个 int nMinGood = max(static_cast(0.9*N), minTriangulated); // 统计四组解中重建的有效3D点个数 > 0.7 * maxGood 的解的数目 // 如果有多个解同时满足该条件,认为结果太接近,nsimilar++,nsimilar>1就认为有问题了,后面返回false int nsimilar = 0; if(nGood1>0.7*maxGood) nsimilar++; if(nGood2>0.7*maxGood) nsimilar++; if(nGood3>0.7*maxGood) nsimilar++; if(nGood4>0.7*maxGood) nsimilar++; // Step 4.4 四个结果中如果没有明显的最优结果,或者没有足够数量的三角化点,则返回失败 // 条件1: 如果四组解能够重建的最多3D点个数小于所要求的最少3D点个数(mMinGood),失败 // 条件2: 如果存在两组及以上的解能三角化出 >0.7*maxGood的点,说明没有明显最优结果,失败 if(maxGood1) { return false; } // Step 4.5 选择最佳解记录结果 // 条件1: 有效重建最多的3D点,即maxGood == nGoodx,也即是位于相机前方的3D点个数最多 // 条件2: 三角化视差角 parallax 必须大于最小视差角 minParallax,角度越大3D点越稳定 //看看最好的good点是在哪种解的条件下发生的 if(maxGood==nGood1) { //如果该种解下的parallax大于函数参数中给定的最小值 if(parallax1>minParallax) { // 存储3D坐标 vP3D = vP3D1; // 获取特征点向量的三角化测量标记 vbTriangulated = vbTriangulated1; // 存储相机姿态 R1.copyTo(R21); t1.copyTo(t21); // 结束 return true; } }else if(maxGood==nGood2) { if(parallax2>minParallax) { vP3D = vP3D2; vbTriangulated = vbTriangulated2; R2.copyTo(R21); t1.copyTo(t21); return true; } }else if(maxGood==nGood3) { if(parallax3>minParallax) { vP3D = vP3D3; vbTriangulated = vbTriangulated3; R1.copyTo(R21); t2.copyTo(t21); return true; } }else if(maxGood==nGood4) { if(parallax4>minParallax) { vP3D = vP3D4; vbTriangulated = vbTriangulated4; R2.copyTo(R21); t2.copyTo(t21); return true; } } // 如果有最优解但是不满足对应的parallax>minParallax,那么返回false表示求解失败 return false; } /** * @brief 用H矩阵恢复R, t和三维点 * H矩阵分解常见有两种方法:Faugeras SVD-based decomposition 和 Zhang SVD-based decomposition * 代码使用了Faugeras SVD-based decomposition算法,参考文献 * Motion and structure from motion in a piecewise planar environment. International Journal of Pattern Recognition and Artificial Intelligence, 1988 * * @param[in] vbMatchesInliers 匹配点对的内点标记 * @param[in] H21 从参考帧到当前帧的单应矩阵 * @param[in] K 相机的内参数矩阵 * @param[in & out] R21 计算出来的相机旋转 * @param[in & out] t21 计算出来的相机平移 * @param[in & out] vP3D 世界坐标系下,三角化测量特征点对之后得到的特征点的空间坐标 * @param[in & out] vbTriangulated 特征点是否成功三角化的标记 * @param[in] minParallax 对特征点的三角化测量中,认为其测量有效时需要满足的最小视差角(如果视差角过小则会引起非常大的观测误差),单位是角度 * @param[in] minTriangulated 为了进行运动恢复,所需要的最少的三角化测量成功的点个数 * @return true 单应矩阵成功计算出位姿和三维点 * @return false 初始化失败 */ bool Initializer::ReconstructH(vector &vbMatchesInliers, cv::Mat &H21, cv::Mat &K, cv::Mat &R21, cv::Mat &t21, vector &vP3D, vector &vbTriangulated, float minParallax, int minTriangulated) { // 目的 :通过单应矩阵H恢复两帧图像之间的旋转矩阵R和平移向量T // 参考 :Motion and structure from motion in a piecewise plannar environment. // International Journal of Pattern Recognition and Artificial Intelligence, 1988 // https://www.researchgate.net/publication/243764888_Motion_and_Structure_from_Motion_in_a_Piecewise_Planar_Environment // 流程: // 1. 根据H矩阵的奇异值d'= d2 或者 d' = -d2 分别计算 H 矩阵分解的 8 组解 // 1.1 讨论 d' > 0 时的 4 组解 // 1.2 讨论 d' < 0 时的 4 组解 // 2. 对 8 组解进行验证,并选择产生相机前方最多3D点的解为最优解 // 统计匹配的特征点对中属于内点(Inlier)或有效点个数 int N=0; for(size_t i=0, iend = vbMatchesInliers.size() ; i(0); float d2 = w.at(1); float d3 = w.at(2); // SVD分解正常情况下特征值di应该是正的,且满足d1>=d2>=d3 if(d1/d2<1.00001 || d2/d3<1.00001) { return false; } // 在ORBSLAM中没有对奇异值 d1 d2 d3按照论文中描述的关系进行分类讨论, 而是直接进行了计算 // 定义8中情况下的旋转矩阵、平移向量和空间向量 vector vR, vt, vn; vR.reserve(8); vt.reserve(8); vn.reserve(8); // Step 1.1 讨论 d' > 0 时的 4 组解 // 根据论文eq.(12)有 // x1 = e1 * sqrt((d1 * d1 - d2 * d2) / (d1 * d1 - d3 * d3)) // x2 = 0 // x3 = e3 * sqrt((d2 * d2 - d2 * d2) / (d1 * d1 - d3 * d3)) // 令 aux1 = sqrt((d1*d1-d2*d2)/(d1*d1-d3*d3)) // aux3 = sqrt((d2*d2-d3*d3)/(d1*d1-d3*d3)) // 则 // x1 = e1 * aux1 // x3 = e3 * aux2 // 因为 e1,e2,e3 = 1 or -1 // 所以有x1和x3有四种组合 // x1 = {aux1,aux1,-aux1,-aux1} // x3 = {aux3,-aux3,aux3,-aux3} float aux1 = sqrt((d1*d1-d2*d2)/(d1*d1-d3*d3)); float aux3 = sqrt((d2*d2-d3*d3)/(d1*d1-d3*d3)); float x1[] = {aux1,aux1,-aux1,-aux1}; float x3[] = {aux3,-aux3,aux3,-aux3}; // 根据论文eq.(13)有 // sin(theta) = e1 * e3 * sqrt(( d1 * d1 - d2 * d2) * (d2 * d2 - d3 * d3)) /(d1 + d3)/d2 // cos(theta) = (d2* d2 + d1 * d3) / (d1 + d3) / d2 // 令 aux_stheta = sqrt((d1*d1-d2*d2)*(d2*d2-d3*d3))/((d1+d3)*d2) // 则 sin(theta) = e1 * e3 * aux_stheta // cos(theta) = (d2*d2+d1*d3)/((d1+d3)*d2) // 因为 e1 e2 e3 = 1 or -1 // 所以 sin(theta) = {aux_stheta, -aux_stheta, -aux_stheta, aux_stheta} float aux_stheta = sqrt((d1*d1-d2*d2)*(d2*d2-d3*d3))/((d1+d3)*d2); float ctheta = (d2*d2+d1*d3)/((d1+d3)*d2); float stheta[] = {aux_stheta, -aux_stheta, -aux_stheta, aux_stheta}; // 计算旋转矩阵 R' //根据不同的e1 e3组合所得出来的四种R t的解 // | ctheta 0 -aux_stheta| | aux1| // Rp = | 0 1 0 | tp = | 0 | // | aux_stheta 0 ctheta | |-aux3| // | ctheta 0 aux_stheta| | aux1| // Rp = | 0 1 0 | tp = | 0 | // |-aux_stheta 0 ctheta | | aux3| // | ctheta 0 aux_stheta| |-aux1| // Rp = | 0 1 0 | tp = | 0 | // |-aux_stheta 0 ctheta | |-aux3| // | ctheta 0 -aux_stheta| |-aux1| // Rp = | 0 1 0 | tp = | 0 | // | aux_stheta 0 ctheta | | aux3| // 开始遍历这四种情况中的每一种 for(int i=0; i<4; i++) { //生成Rp,就是eq.(8) 的 R' cv::Mat Rp=cv::Mat::eye(3,3,CV_32F); Rp.at(0,0)=ctheta; Rp.at(0,2)=-stheta[i]; Rp.at(2,0)=stheta[i]; Rp.at(2,2)=ctheta; // eq.(8) 计算R cv::Mat R = s*U*Rp*Vt; // 保存 vR.push_back(R); // eq. (14) 生成tp cv::Mat tp(3,1,CV_32F); tp.at(0)=x1[i]; tp.at(1)=0; tp.at(2)=-x3[i]; tp*=d1-d3; // 这里虽然对t有归一化,并没有决定单目整个SLAM过程的尺度 // 因为CreateInitialMapMonocular函数对3D点深度会缩放,然后反过来对 t 有改变 // eq.(8)恢复原始的t cv::Mat t = U*tp; vt.push_back(t/cv::norm(t)); // 构造法向量np cv::Mat np(3,1,CV_32F); np.at(0)=x1[i]; np.at(1)=0; np.at(2)=x3[i]; // eq.(8) 恢复原始的法向量 cv::Mat n = V*np; // 保持平面法向量向上 if(n.at(2)<0) n=-n; vn.push_back(n); } // Step 1.2 讨论 d' < 0 时的 4 组解 float aux_sphi = sqrt((d1*d1-d2*d2)*(d2*d2-d3*d3))/((d1-d3)*d2); // cos_theta项 float cphi = (d1*d3-d2*d2)/((d1-d3)*d2); // 考虑到e1,e2的取值,这里的sin_theta有两种可能的解 float sphi[] = {aux_sphi, -aux_sphi, -aux_sphi, aux_sphi}; // 对于每种由e1 e3取值的组合而形成的四种解的情况 for(int i=0; i<4; i++) { // 计算旋转矩阵 R' cv::Mat Rp=cv::Mat::eye(3,3,CV_32F); Rp.at(0,0)=cphi; Rp.at(0,2)=sphi[i]; Rp.at(1,1)=-1; Rp.at(2,0)=sphi[i]; Rp.at(2,2)=-cphi; // 恢复出原来的R cv::Mat R = s*U*Rp*Vt; // 然后添加到vector中 vR.push_back(R); // 构造tp cv::Mat tp(3,1,CV_32F); tp.at(0)=x1[i]; tp.at(1)=0; tp.at(2)=x3[i]; tp*=d1+d3; // 恢复出原来的t cv::Mat t = U*tp; // 归一化之后加入到vector中,要提供给上面的平移矩阵都是要进行过归一化的 vt.push_back(t/cv::norm(t)); // 构造法向量np cv::Mat np(3,1,CV_32F); np.at(0)=x1[i]; np.at(1)=0; np.at(2)=x3[i]; // 恢复出原来的法向量 cv::Mat n = V*np; // 保证法向量指向上方 if(n.at(2)<0) n=-n; // 添加到vector中 vn.push_back(n); } // 最好的good点 int bestGood = 0; // 其次最好的good点 int secondBestGood = 0; // 最好的解的索引,初始值为-1 int bestSolutionIdx = -1; // 最大的视差角 float bestParallax = -1; // 存储最好解对应的,对特征点对进行三角化测量的结果 vector bestP3D; // 最佳解所对应的,那些可以被三角化测量的点的标记 vector bestTriangulated; // Instead of applying the visibility constraints proposed in the Faugeras' paper (which could fail for points seen with low parallax) // We reconstruct all hypotheses and check in terms of triangulated points and parallax // Step 2. 对 8 组解进行验证,并选择产生相机前方最多3D点的解为最优解 for(size_t i=0; i<8; i++) { // 第i组解对应的比较大的视差角 float parallaxi; // 三角化测量之后的特征点的空间坐标 vector vP3Di; // 特征点对是否被三角化的标记 vector vbTriangulatedi; // 调用 Initializer::CheckRT(), 计算good点的数目 int nGood = CheckRT(vR[i],vt[i], //当前组解的旋转矩阵和平移向量 mvKeys1,mvKeys2, //特征点 mvMatches12,vbMatchesInliers, //特征匹配关系以及Inlier标记 K, //相机的内参数矩阵 vP3Di, //存储三角化测量之后的特征点空间坐标的 4.0*mSigma2, //三角化过程中允许的最大重投影误差 vbTriangulatedi, //特征点是否被成功进行三角测量的标记 parallaxi); // 这组解在三角化测量的时候的比较大的视差角 // 更新历史最优和次优的解 // 保留最优的和次优的解.保存次优解的目的是看看最优解是否突出 if(nGood>bestGood) { // 如果当前组解的good点数是历史最优,那么之前的历史最优就变成了历史次优 secondBestGood = bestGood; // 更新历史最优点 bestGood = nGood; // 最优解的组索引为i(就是当前次遍历) bestSolutionIdx = i; // 更新变量 bestParallax = parallaxi; bestP3D = vP3Di; bestTriangulated = vbTriangulatedi; } // 如果当前组的good计数小于历史最优但却大于历史次优 else if(nGood>secondBestGood) { // 说明当前组解是历史次优点,更新之 secondBestGood = nGood; } } // Step 3 选择最优解。要满足下面的四个条件 // 1. good点数最优解明显大于次优解,这里取0.75经验值 // 2. 视角差大于规定的阈值 // 3. good点数要大于规定的最小的被三角化的点数量 // 4. good数要足够多,达到总数的90%以上 if(secondBestGood<0.75*bestGood && bestParallax>=minParallax && bestGood>minTriangulated && bestGood>0.9*N) { // 从最佳的解的索引访问到R,t vR[bestSolutionIdx].copyTo(R21); vt[bestSolutionIdx].copyTo(t21); // 获得最佳解时,成功三角化的三维点,以后作为初始地图点使用 vP3D = bestP3D; // 获取特征点的被成功进行三角化的标记 vbTriangulated = bestTriangulated; //返回真,找到了最好的解 return true; } return false; } /** 给定投影矩阵P1,P2和图像上的匹配特征点点kp1,kp2,从而计算三维点坐标 * @brief * * @param[in] kp1 特征点, in reference frame * @param[in] kp2 特征点, in current frame * @param[in] P1 投影矩阵P1 * @param[in] P2 投影矩阵P2 * @param[in & out] x3D 计算的三维点 */ void Initializer::Triangulate( const cv::KeyPoint &kp1, //特征点, in reference frame const cv::KeyPoint &kp2, //特征点, in current frame const cv::Mat &P1, //投影矩阵P1 const cv::Mat &P2, //投影矩阵P2 cv::Mat &x3D) //三维点 { // 原理 // Trianularization: 已知匹配特征点对{x x'} 和 各自相机矩阵{P P'}, 估计三维点 X // x' = P'X x = PX // 它们都属于 x = aPX模型 // |X| // |x| |p1 p2 p3 p4 ||Y| |x| |--p0--||.| // |y| = a |p5 p6 p7 p8 ||Z| ===>|y| = a|--p1--||X| // |z| |p9 p10 p11 p12||1| |z| |--p2--||.| // 采用DLT的方法:x叉乘PX = 0 // |yp2 - p1| |0| // |p0 - xp2| X = |0| // |xp1 - yp0| |0| // 两个点: // |yp2 - p1 | |0| // |p0 - xp2 | X = |0| ===> AX = 0 // |y'p2' - p1' | |0| // |p0' - x'p2'| |0| // 变成程序中的形式: // |xp2 - p0 | |0| // |yp2 - p1 | X = |0| ===> AX = 0 // |x'p2'- p0'| |0| // |y'p2'- p1'| |0| // 然后就组成了一个四元一次正定方程组,SVD求解,右奇异矩阵的最后一行就是最终的解. //这个就是上面注释中的矩阵A cv::Mat A(4,4,CV_32F); //构造参数矩阵A A.row(0) = kp1.pt.x*P1.row(2)-P1.row(0); A.row(1) = kp1.pt.y*P1.row(2)-P1.row(1); A.row(2) = kp2.pt.x*P2.row(2)-P2.row(0); A.row(3) = kp2.pt.y*P2.row(2)-P2.row(1); //奇异值分解的结果 cv::Mat u,w,vt; //对系数矩阵A进行奇异值分解 cv::SVD::compute(A,w,u,vt,cv::SVD::MODIFY_A| cv::SVD::FULL_UV); //根据前面的结论,奇异值分解右矩阵的最后一行其实就是解,原理类似于前面的求最小二乘解,四个未知数四个方程正好正定 //别忘了我们更习惯用列向量来表示一个点的空间坐标 x3D = vt.row(3).t(); //为了符合其次坐标的形式,使最后一维为1 x3D = x3D.rowRange(0,3)/x3D.at(3); } /** * @brief 归一化特征点到同一尺度,作为后续normalize DLT的输入 * [x' y' 1]' = T * [x y 1]' * 归一化后x', y'的均值为0,sum(abs(x_i'-0))=1,sum(abs((y_i'-0))=1 * * 为什么要归一化? * 在相似变换之后(点在不同的坐标系下),他们的单应性矩阵是不相同的 * 如果图像存在噪声,使得点的坐标发生了变化,那么它的单应性矩阵也会发生变化 * 我们采取的方法是将点的坐标放到同一坐标系下,并将缩放尺度也进行统一 * 对同一幅图像的坐标进行相同的变换,不同图像进行不同变换 * 缩放尺度是为了让噪声对于图像的影响在一个数量级上 * * Step 1 计算特征点X,Y坐标的均值 * Step 2 计算特征点X,Y坐标离均值的平均偏离程度 * Step 3 将x坐标和y坐标分别进行尺度归一化,使得x坐标和y坐标的一阶绝对矩分别为1 * Step 4 计算归一化矩阵:其实就是前面做的操作用矩阵变换来表示而已 * * @param[in] vKeys 待归一化的特征点 * @param[in & out] vNormalizedPoints 特征点归一化后的坐标 * @param[in & out] T 归一化特征点的变换矩阵 */ void Initializer::Normalize(const vector &vKeys, vector &vNormalizedPoints, cv::Mat &T) //将特征点归一化的矩阵 { // 归一化的是这些点在x方向和在y方向上的一阶绝对矩(随机变量的期望)。 // Step 1 计算特征点X,Y坐标的均值 meanX, meanY float meanX = 0; float meanY = 0; //获取特征点的数量 const int N = vKeys.size(); //设置用来存储归一后特征点的向量大小,和归一化前保持一致 vNormalizedPoints.resize(N); //开始遍历所有的特征点 for(int i=0; i(0,0) = sX; T.at(1,1) = sY; T.at(0,2) = -meanX*sX; T.at(1,2) = -meanY*sY; } /** * @brief 用R,t来对特征匹配点三角化,并根据三角化结果判断R,t的合法性 * * @param[in] R 旋转矩阵R * @param[in] t 平移矩阵t * @param[in] vKeys1 参考帧特征点 * @param[in] vKeys2 当前帧特征点 * @param[in] vMatches12 两帧特征点的匹配关系 * @param[in] vbMatchesInliers 特征点对内点标记 * @param[in] K 相机内参矩阵 * @param[in & out] vP3D 三角化测量之后的特征点的空间坐标 * @param[in] th2 重投影误差的阈值 * @param[in & out] vbGood 标记成功三角化点? * @param[in & out] parallax 计算出来的比较大的视差角(注意不是最大,具体看后面代码) * @return int */ int Initializer::CheckRT(const cv::Mat &R, const cv::Mat &t, const vector &vKeys1, const vector &vKeys2, const vector &vMatches12, vector &vbMatchesInliers, const cv::Mat &K, vector &vP3D, float th2, vector &vbGood, float ¶llax) { // 对给出的特征点对及其R t , 通过三角化检查解的有效性,也称为 cheirality check //特征点是否是good点的标记,这里的特征点指的是参考帧中的特征点 vbGood = vector(vKeys1.size(),false); //重设存储空间坐标的点的大小 vP3D.resize(vKeys1.size()); //存储计算出来的每对特征点的视差 vector vCosParallax; vCosParallax.reserve(vKeys1.size()); // Camera 1 Projection Matrix K[I|0] // Step 1:计算相机的投影矩阵 // 投影矩阵P是一个 3x4 的矩阵,可以将空间中的一个点投影到平面上,获得其平面坐标,这里均指的是齐次坐标。 // 对于第一个相机是 P1=K*[I|0] // 以第一个相机的光心作为世界坐标系, 定义相机的投影矩阵 cv::Mat P1(3,4, //矩阵的大小是3x4 CV_32F, //数据类型是浮点数 cv::Scalar(0)); //初始的数值是0 //将整个K矩阵拷贝到P1矩阵的左侧3x3矩阵,因为 K*I = K K.copyTo(P1.rowRange(0,3).colRange(0,3)); // 第一个相机的光心设置为世界坐标系下的原点 cv::Mat O1 = cv::Mat::zeros(3,1,CV_32F); // Camera 2 Projection Matrix K[R|t] // 计算第二个相机的投影矩阵 P2=K*[R|t] cv::Mat P2(3,4,CV_32F); R.copyTo(P2.rowRange(0,3).colRange(0,3)); t.copyTo(P2.rowRange(0,3).col(3)); //最终结果是K*[R|t] P2 = K*P2; // 第二个相机的光心在世界坐标系下的坐标 cv::Mat O2 = -R.t()*t; //在遍历开始前,先将good点计数设置为0 int nGood=0; // 开始遍历所有的特征点对 for(size_t i=0, iend=vMatches12.size();i(0)) || !isfinite(p3dC1.at(1)) || !isfinite(p3dC1.at(2))) { //其实这里就算是不这样写也没问题,因为默认的匹配点对就不是good点 vbGood[vMatches12[i].first]=false; //继续对下一对匹配点的处理 continue; } // Check parallax // Step 4 第二关:通过三维点深度值正负、两相机光心视差角大小来检查是否合法 //得到向量PO1 cv::Mat normal1 = p3dC1 - O1; //求取模长,其实就是距离 float dist1 = cv::norm(normal1); //同理构造向量PO2 cv::Mat normal2 = p3dC1 - O2; //求模长 float dist2 = cv::norm(normal2); //根据公式:a.*b=|a||b|cos_theta 可以推导出来下面的式子 float cosParallax = normal1.dot(normal2)/(dist1*dist2); // Check depth in front of first camera (only if enough parallax, as "infinite" points can easily go to negative depth) // 如果深度值为负值,为非法三维点跳过该匹配点对 // ?视差比较小时,重投影误差比较大。这里0.99998 对应的角度为0.36°,这里不应该是 cosParallax>0.99998 吗? // ?因为后面判断vbGood 点时的条件也是 cosParallax<0.99998 // !可能导致初始化不稳定 if(p3dC1.at(2)<=0 && cosParallax<0.99998) continue; // Check depth in front of second camera (only if enough parallax, as "infinite" points can easily go to negative depth) // 讲空间点p3dC1变换到第2个相机坐标系下变为p3dC2 cv::Mat p3dC2 = R*p3dC1+t; //判断过程和上面的相同 if(p3dC2.at(2)<=0 && cosParallax<0.99998) continue; // Step 5 第三关:计算空间点在参考帧和当前帧上的重投影误差,如果大于阈值则舍弃 // Check reprojection error in first image cv::Point2f uv1 = mpCamera->project(p3dC1); //参考帧上的重投影误差,这个的确就是按照定义来的 float squareError1 = (uv1.x-kp1.pt.x)*(uv1.x-kp1.pt.x)+(uv1.y-kp1.pt.y)*(uv1.y-kp1.pt.y); // 重投影误差太大,跳过淘汰 if(squareError1>th2) continue; // Check reprojection error in second image cv::Point2f uv2 = mpCamera->project(p3dC2); float squareError2 = (uv2.x-kp2.pt.x)*(uv2.x-kp2.pt.x)+(uv2.y-kp2.pt.y)*(uv2.y-kp2.pt.y); // 重投影误差太大,跳过淘汰 if(squareError2>th2) continue; // Step 6 统计经过检验的3D点个数,记录3D点视差角 // 如果运行到这里就说明当前遍历的这个特征点对靠谱,经过了重重检验,说明是一个合格的点,称之为good点 vCosParallax.push_back(cosParallax); //存储这个三角化测量后的3D点在世界坐标系下的坐标 vP3D[vMatches12[i].first] = cv::Point3f(p3dC1.at(0),p3dC1.at(1),p3dC1.at(2)); //good点计数++ nGood++; //判断视差角,只有视差角稍稍大一丢丢的才会给打good点标记 //? bug 我觉得这个写的位置不太对。你的good点计数都++了然后才判断,不是会让good点标志和good点计数不一样吗 if(cosParallax<0.99998) vbGood[vMatches12[i].first]=true; } // Step 7 得到3D点中较小的视差角,并且转换成为角度制表示 if(nGood>0) { // 从小到大排序,注意vCosParallax值越大,视差越小 sort(vCosParallax.begin(),vCosParallax.end()); // !排序后并没有取最小的视差角,而是取一个较小的视差角 // 作者的做法:如果经过检验过后的有效3D点小于50个,那么就取最后那个最小的视差角(cos值最大) // 如果大于50个,就取排名第50个的较小的视差角即可,为了避免3D点太多时出现太小的视差角 size_t idx = min(50,int(vCosParallax.size()-1)); //将这个选中的角弧度制转换为角度制 parallax = acos(vCosParallax[idx])*180/CV_PI; } else //如果没有good点那么这个就直接设置为0了 parallax=0; //返回good点计数 return nGood; } /** * @brief 分解Essential矩阵得到R,t * 分解E矩阵将得到4组解,这4组解分别为[R1,t],[R1,-t],[R2,t],[R2,-t] * 参考:Multiple View Geometry in Computer Vision - Result 9.19 p259 * @param[in] E 本质矩阵 * @param[in & out] R1 旋转矩阵1 * @param[in & out] R2 旋转矩阵2 * @param[in & out] t 平移向量,另外一个取相反数 */ void Initializer::DecomposeE(const cv::Mat &E, cv::Mat &R1, cv::Mat &R2, cv::Mat &t) { // 对本质矩阵进行奇异值分解 //准备存储对本质矩阵进行奇异值分解的结果 cv::Mat u,w,vt; //对本质矩阵进行奇异值分解 cv::SVD::compute(E,w,u,vt); u.col(2).copyTo(t); t=t/cv::norm(t); // 构造一个绕Z轴旋转pi/2的旋转矩阵W,按照下式组合得到旋转矩阵 R1 = u*W*vt //计算完成后要检查一下旋转矩阵行列式的数值,使其满足行列式为1的约束 cv::Mat W(3,3,CV_32F,cv::Scalar(0)); W.at(0,1)=-1; W.at(1,0)=1; W.at(2,2)=1; //计算 R1 = u*W*vt; //旋转矩阵有行列式为+1的约束,所以如果算出来为负值,需要取反 if(cv::determinant(R1)<0) R1=-R1; // 同理将矩阵W取转置来按照相同的公式计算旋转矩阵R2 = u*W.t()*vt R2 = u*W.t()*vt; //旋转矩阵有行列式为1的约束 if(cv::determinant(R2)<0) R2=-R2; } } //namespace ORB_SLAM