PTA 清点代码库 (25 分)-CFANZ编程社区

上图转自新浪微博：“阿里代码库有几亿行代码，但其中有很多功能重复的代码，比如单单快排就被重写了几百遍。请设计一个程序，能够将代码库中所有功能重复的代码找出。各位大佬有啥想法，我当时就懵了，然后就挂了。。。”

这里我们把问题简化一下：首先假设两个功能模块如果接受同样的输入，总是给出同样的输出，则它们就是功能重复的；其次我们把每个模块的输出都简化为一个整数（在 int 范围内）。于是我们可以设计一系列输入，检查所有功能模块的对应输出，从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。

输入格式：

输入在第一行中给出 2 个正整数，依次为 N（≤104）和 M（≤102），对应功能模块的个数和系列测试输入的个数。

随后 N 行，每行给出一个功能模块的 M 个对应输出，数字间以空格分隔。

输出格式：

首先在第一行输出不同功能的个数 K。随后 K 行，每行给出具有这个功能的模块的个数，以及这个功能的对应输出。数字间以 1 个空格分隔，行首尾不得有多余空格。输出首先按模块个数非递增顺序，如果有并列，则按输出序列的递增序给出。

注：所谓数列 { A1, ..., AM } 比 { B1, ..., BM } 大，是指存在 1≤i<M，使得 A1=B1，...，Ai=Bi 成立，且 Ai+1>Bi+1。

输入样例：

输出样例：

一开始是用string类型来存储这些数字的但是数字可能会有负数(这是我认为的坑点)变成string类型排序会出问题,后来就用vector+map来直接存储数字

#include<bits/stdc++.h>
using namespace std;
struct Node{
    int id;
    string name;
    int num;
}s[10005];
bool cmp(Node a,Node b){
    if(a.num==b.num){
        return a.id<b.id;
    }
    return a.num>b.num;
}
int main() {
    ios::sync_with_stdio(false);
    int n, m, t;
    map<vector<int>, int> mp;
    cin >> n >> m;
    mp.clear();
    for (int i = 1; i <= n; i++) {
        vector<int> vi;
        vi.clear();
        for (int j = 1; j <= m; j++) {
            cin >> t;
            vi.push_back(t);
        }
        mp[vi]++;
    }
    int cnt=0;
    cout << mp.size() << endl;
    for (auto i:mp) {
        cnt++;
        s[cnt].id=cnt;
        s[cnt].num=i.second;
        string str="";
        bool flag=0;
        for(auto l:i.first){
            if(flag!=0) str+=" ";
            str+= to_string(l);
            flag=1;
        }
        s[cnt].name=str;
    }
    sort(s+1,s+1+cnt,cmp);
    for(int i=1;i<=cnt;i++){
        cout<<s[i].num<<" "<<s[i].name<<endl;
    }
    return 0;
}